今天看啥  ›  专栏  ›  CSDN

漫画:如何用字典树进行 500 万量级的单词统计?

CSDN  · 公众号  · 科技媒体  · 2018-10-19 16:40
作者 | channingbreeze责编 | 胡巍巍小史是一个应届生,虽然学的是电子专业,但是自己业余时间看了很多互联网与编程方面的书,一心想进BAT互联网公司。今天小史去了一家在线英语培训公司面试了。简单的自我介绍后,面试官给了小史一个问题。面试现场题目:我有500w个单词,你帮忙设计一个数据结构来进行存储,存好之后,我有两个需求。1、来了一个新的单词,需要判断是否在这500w个单词中2、来了一个单词前缀,给出500w个单词中有多少个单词是该前缀小史这次没有不假思索就给出回答,他学会了深沉。小史回忆起吕老师之前教他的Bitmap算法。小史心想:Bitmap可以判断一个数是否在40亿个int32数中,其核心是每一个数映射成一个位,同时申请的bit位数覆盖了整个int32 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照