NLP-不同格式的词向量的保存与加载 - 好文

训练好的词向量可以保存成几种不同的格式，而每种格式的加载方式却不尽相同，现简单记录一下。。。

1.以model.save()方法保存词向量

* 保存词向量 import gensim model = gensim.models.Word2Vec(documents, size=300)
model.train(documents, total_examples=len(documents), epochs=10) model.save(
"../input/Word2vec.w2v")
* 加载词向量 import gensim word2vec = gensim.models.word2vec.Word2Vec.load(
"./input/Quora.w2v").wv
2.保存为二进制的词向量

* 保存词向量 model.wv.save_Word2Vec_format(embedding_path,binary=True)
#model.wv.save_Word2Vec_format(embedding_path,binary=False)非二进制
* 加载词向量 import gensim word2vec = gensim.models.KeyedVectors.load
_word2vec_format(embedding_path,binary=True)
3.使用numpy进行保存和加载

保存数组数据的文件可以是二进制格式或者文本格式，二进制格式的文件可以是Numpy专用的二进制类型和无格式类型。

* 使用np.save()保存npy文件，np.load()加载npy文件。

热门工具换一换