使用word2vec的几种方法 - 好文

使用word2vec的几种方法

先导入可能用到的包

from gensim.models import Word2Vec import gensim.models.word2vec as w2v
第一种：语料放在文件里面，这个语料是先要分好词的

source_code_path = '../data/sourceData/word2vecFile.txt' sentences =
w2v.LineSentence(source_code_path) model = Word2Vec(sentences,size=300,window=5,
min_count=1,workers=2) print(model.similarity('广告','广东')) #查看两个词的相似度 print
(model.wv['广告']) # 查看这个词的词向量 print(model.most_similar('广告')) # 查看和这个词最相关的几个词
第二种：语料库是一个list

sentences = [["cat", "say", "meow"], ["dog", "say", "woof"]] model =
Word2Vec(sentences,size=300,window=5,min_count=1,workers=2) print
(model.similarity('cat','dog')) print(model.wv['cat']) print(model.most_similar(
'cat'))

热门工具换一换

1 进制转换
2 GIF生成器
3 时间戳转换器
4 Cron表达式生成器
5 身份证归属地、性别、出生日期、年龄查询
6 计算器
7 衣服尺码计算
8 文本对比
9 图像颜色识别
10 图像文字识别
11 Base64编码解码
12 日期计算器
13 人脸识别
14 照片转素描
15 摩斯电码
16 颜色选择器
17 文字加密解密
18 单位换算
19 端口扫描器
20 卡通头像制作