【Python学习笔记】词频统计

所用版本:Python 3.6,jieba 0.42.1,nltk 3.2.4,wordcloud 1.8.1

NLTK统计

将分词后的结果放入list,调用nltk.FreqDist()进行频数统计。支持用下标查询某个词语的频数。用most_common(k)函数可以将频数排名前k的词语存入一个list,list中的元素类型为tuple。

生成词云

先生成存放着频数的字典,然后调用wordcloud.WordCloud().fit_words()生成词云。

Subscribe
提醒
guest
0 评论
Inline Feedbacks
View all comments