找到100亿个URL中重复的URL以及搜索词汇的top K 问题 2024年6月11日 算法-大数据 0条评论 12次阅读 0人点赞 前天去腾讯面试大数据开发,问到的题目,总结一下。 题目一、有一个包含100亿个URL的大文件,假设每个URL占用16B,请找出其中所有重复的URL。 题目二、某搜索公司一天的用户搜索词汇是海量的百亿数据量,请设计一种求出…