使用木槌,我可以获得特定数量的主题及其单词。如何确保主题词符合概率分布(即总和为一)?
例如,如果我按如下方式运行它,如何使用 mallet 给出的输出来确保主题 0 的主题词的概率加起来为 1?
mallet train-topics --input text.vectors --output-topic-keys topics.txt --output-doc-topics doc_comp.txt --topic-word-weights-file weights.txt --num-top-words 50 --word-topic-counts-file counts.txt --num-topics 3 --output-state topicstate.gz --alpha 1
None
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)