今天在看http://www.cnblogs.com/smart-code/archive/2012/09/23/2699053.html,文章最后优化sort的时候一笔带过,没看懂,
想起以前面试碰到的类似 top k 问题,上网找了找相关文章,先记下来
十道海量数据处理面试题与十个方法大总结
http://blog.csdn.net/v_JULY_v/article/details/6279498
十一、从头到尾彻底解析Hash表算法 (top k)
http://blog.csdn.net/v_JULY_v/article/details/6256463
怎样从10亿查询词找出出现频率最高的10个
http://dongxicheng.org/big-data/select-ten-from-billions/