描述一个算法,在十亿个(n)数中找出前一百万(k)大的数字。假设内存里可以放下十亿个数。
思路:
1、直接排序,然后输出前一百万个数,时间复杂度为O(n*logn)。
2、维护一个大小为一百万的大顶推,然后遍历完十亿个数,输出大顶推的数即可,时间复杂度为O(n*logk)。该思路适合大数据,尤其是内存放不下所有数据的时候。
3、利用快排的思想进行划分,一次划分后设主元的位置为index,如果index == k,输出前k个数;如果index > k,继续在左半部分进行划分寻找k;如果index < k,输出左半部分的数,继续在右半部分进行划分寻找剩下的k – index个数。时间复杂度为O(n)。
类似的题有:找出n个数中第k大(小)的数。