训练好的词向量可以保存成几种不同的格式,而每种格式的加载方式却不尽相同,现简单记录一下。。。
1.以model.save()方法保存词向量
* 保存词向量 import gensim model = gensim.models.Word2Vec(documents, size=300)
model.train(documents, total_examples=len(documents), epochs=10) model.save(
"../input/Word2vec.w2v")
* 加载词向量 import gensim word2vec = gensim.models.word2vec.Word2Vec.load(
"./input/Quora.w2v").wv
2.保存为二进制的词向量
* 保存词向量 model.wv.save_Word2Vec_format(embedding_path,binary=True)
#model.wv.save_Word2Vec_format(embedding_path,binary=False)非二进制
* 加载词向量 import gensim word2vec = gensim.models.KeyedVectors.load
_word2vec_format(embedding_path,binary=True)
3.使用numpy进行保存和加载
保存数组数据的文件可以是二进制格式或者文本格式,二进制格式的文件可以是Numpy专用的二进制类型和无格式类型。
* 使用np.save()保存npy文件,np.load()加载npy文件。
热门工具 换一换