标签:pyspark

PySpark初体验!

1、引言 突发奇想,想做这样一件事,有一堆句子,每个句子都已经表示成了特征向量。当有一个新句子到来的时候,如何计算这个新句子与这一堆句子的相似性? 嗨呀,这还不简单么,循环计算,再排个序不就行了么。对,这样的想法当然没错…