训练好的词向量可以保存成几种不同的格式,而每种格式的加载方式却不尽相同,现简单记录一下。。。

1.以model.save()方法保存词向量

* 保存词向量 import gensim model = gensim.models.Word2Vec(documents, size=300)
model.train(documents, total_examples=len(documents), epochs=10) model.save(
"../input/Word2vec.w2v")
* 加载词向量 import gensim word2vec = gensim.models.word2vec.Word2Vec.load(
"./input/Quora.w2v").wv
2.保存为二进制的词向量

* 保存词向量 model.wv.save_Word2Vec_format(embedding_path,binary=True)
#model.wv.save_Word2Vec_format(embedding_path,binary=False)非二进制
* 加载词向量 import gensim word2vec = gensim.models.KeyedVectors.load
_word2vec_format(embedding_path,binary=True)
3.使用numpy进行保存和加载

保存数组数据的文件可以是二进制格式或者文本格式,二进制格式的文件可以是Numpy专用的二进制类型和无格式类型。

* 使用np.save()保存npy文件,np.load()加载npy文件。

友情链接
KaDraw流程图
API参考文档
OK工具箱
云服务器优惠
阿里云优惠券
腾讯云优惠券
华为云优惠券
站点信息
问题反馈
邮箱:[email protected]
QQ群:637538335
关注微信