看啥推荐读物
专栏名称: 码农翻身
工作15年的前IBM架构师分享好玩有趣的编程知识和职场的经验教训, 不容错过。
今天看啥  ›  专栏  ›  码农翻身

二面腾讯没过,因为算法基本功问题……

码农翻身  · 公众号  · 程序员  · 2021-01-14 08:51
“给你 a、b 两个文件,各存放 50 亿条 URL,每条 URL 占用 64 字节,内存限制是 4G,请你编写代码找出 a、b 文件中相同的 URL”,这是某大厂的一道秋招笔试题。如果面试的人是你,会怎么回答?50 亿条 URL,每个 64 字节,加起来就是 320G,最简单不用动脑筋的方法,就是把他们加载到内存里直接比对,但数据量太大,根本行不通。进一步分析,你可能会想到对文件做拆分,对 URL 做排序,然后逐步做分析。但数据量这么大,具体怎么做呢?总不能说,我把 50 亿条 URL,按从前到后的顺序,拆分为 2000 个文件,然后挨个对比,多做几次,结果就出来了。虽然这样能行,但也意味着你会被淘汰。因为这就是面试官要考察的关键点。对这样的题目,面试官想看到的是你能否想到 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照