web
使用python版的wrod2vec工具gensim来训练词向量。词向量维数设置为100,训练出来的词向量词典大小为38053.gensim训练词向量的代码特别简单:
model = gensim.models.Word2Vec(sentences, size=100,
window=5, min_count=3, sg=1, max_vocab_size=vocabulary_size)
model.wv.save_word2vec_format(wrod2vec,
"word2vec/vocabulary",binary=False)