建议安装:
pip install pyLDAvis==2.1.2
否则会报错:FileNotFoundError: [Errno 2] No such file or directory: 'https://cdn.jsdelivr.net/gh/bmabey/pyLDAvis@3.3.1/pyLDAvis/js/ldavis.v1.0.0.css'
使用示例
- 运行
pyLDAvis
示例:
import pyLDAvis.gensim
from gensim import corpora
from gensim.models import ldamodel
sentence_list = [
['青绿色', '放', '几天', '塑料袋', '里', '刺鼻', '气味', '药水', '味道', '说', '选择', '应季', '水果', '最佳', '踩', '雷', '水果'],
['徒有其表', '皮厚肉', '渣', '一点', '甜', '入口', '评论', '欺骗', '消费者'], ['果子', '全是', '伤', '放', '烂', '几个', '放', '烂', '几个'],
['路边', '两块钱', '一斤', '橙子', '没什么', '区别', '水分', '甜度', '称为', '品牌', '京东', '买', '水果', '三思'],
['橙子', '酸', '一点', '不值'], ['垃圾', '沒', '水份', '别买'], ['质量', '太差', '坏', '吃'],
['杨氏', '真', '买', '砸', '招牌', '皮厚肉', '干麻'],
['生鲜', '越来越', '不行', '一点', '品质', '售后服务', '可言'],
['买', '箱来', '送', '反馈', '说', '干', '京东', '搞', '飞机', '害人不浅'],
['橙子', '品质', '太差', '三个', '霉变'],
['新鲜', '橙子', '两头', '干枯', '水分', '新货']
]
# 训练 LDA
lda_dictionary = corpora.Dictionary(sentence_list)
lda_corpus = [lda_dictionary.doc2bow(sentence) for sentence in sentence_list]
lda_model = ldamodel.LdaModel(corpus=lda_corpus, id2word=lda_dictionary, num_topics=4)
# 使用 pyLDAvis
vis_data = pyLDAvis.gensim.prepare(lda_model, lda_corpus, lda_dictionary)
pyLDAvis.show(vis_data, open_browser=False)
pyLDAvis.save_html(vis_data, 'save_local.html')
- 如果无特殊方法,可能无法下载这三个文件:
https://cdn.rawgit.com/bmabey/pyLDAvis/files/ldavis.v1.0.0.css
https://cdnjs.cloudflare.com/ajax/libs/d3/3.5.5/d3.min
https://cdn.rawgit.com/bmabey/pyLDAvis/files/ldavis.v1.0.0.js
三份文件与绘图实例,可以到博主上传的文件这里免费下载:https://download.csdn.net/download/weixin_35757704/82465448
可以把这三个文件下载到本地,然后修改save_local.html
文件的路径即可
- 示例效果: