自我介绍
讲讲比较擅长的项目
讲讲LSTM
TFIDF, LDA, 是否有动手复现
XGB LGB及其优势和原因
文本聚类,KMeans,如何选取初始中心点,如何确定K值。
算法题:
1 两个有序序列的中位数,算法复杂度 O(log(m+n)) 没有完成
2 打印螺旋矩阵
3 严格递增数组A [1,3,4,5,6,8],循环后B [5,6,8,1,3,4],给定x ,输出在B中下标,
4 给定100亿个数,计算最大的100个数各自出现的次数
5 给定100亿篇文章,对于一篇新的文章,找出对应最相似的文章。(词的选择可以考虑使用TFIDF)