今天照着网上讲解写一段 python训练了Word2Vec模型的代码,遇到了一个没见过的报错(其实之前没接触过 python, 除傻白甜报错之外,都看不太懂)
代码段如下:
python
1 | model = word2vec.Word2Vec.load('text.txt') |
报错如下:
python
1 | Use KeyedVector's .key_to_index dict, .index_to_key list, and methods .get_vecattr(key, attr) and .set_vecattr(key, attr, new_val) instead |
简单google 了一下,发现是gensim4.0 版本有些方法不支持了。
我的这段代码需要改成
python
1 | model = word2vec.Word2Vec.load('text.txt') |
就可以了~
关于gensim 3.x 到 gensim4.0的升级改动,参考文档
借助此次做分词、文本聚类的机会,好好学习一下自然语言处理的基础知识点和python


