NLTK

在 NLTK 中实现词袋朴素贝叶斯分类器

我基本上有和这个人有同样的问题 https stackoverflow com questions 2162718 python nltk code snippet to train a classifier naive bayes usi

python machinelearning NLP NLTK naivebayes

主题分布：在python中进行LDA后如何查看哪个文档属于哪个主题

我能够运行 gensim 中的 LDA 代码并获得前 10 个主题及其各自的关键字现在我想进一步了解 LDA 算法的准确性方法是查看它们将哪些文档聚类到每个主题中这在 gensim LDA 中可能吗基本上我想做这样的事情但是在

python NLTK LDA gensim

将 POS 标签从 TextBlob 转换为 Wordnet 兼容输入

我使用 Python 和 nltk Textblob 进行一些文本分析有趣的是您可以为 wordnet 添加 POS 以使同义词搜索更加具体但不幸的是 nltk 和 Textblob 中的标记与 wordnet 对其同义词集类期望的输

python tags NLP NLTK textblob

使用正则表达式对使用“但是”一词的句子进行分块

我正在尝试使用正则表达式在但是一词或任何其他协调连词处对句子进行分块它不起作用 sentence nltk pos tag word tokenize There are no large collections present

python regex NLTK chunking

使用 WordNet 确定两个文本之间的语义相似度？

如何使用 WordNet 确定 python 中两个文本之间的语义相似度明显的预处理是删除停用词和词干但是然后呢我能想到的唯一方法是计算两个文本中每个单词之间的 WordNet 路径距离这是一元语法的标准但这些都是大型 400 个

python NLP NLTK WordNet semanticanalysis

Python 中与语法、标记、词干和词义消歧有关的一些 NLP 内容

背景 TLDR 为了完成而提供寻求有关奇怪需求的最佳解决方案的建议我是一名大学四年级的文学学生只有我自己的编程指导我对Python有足够的能力所以我不会在实现我找到的解决方案大多数时候并在它们的基础上进行开发时遇到麻烦但

python NLP grammar tagging NLTK

在 Python Pandas 中训练朴素贝叶斯的不同类型的特征

我想使用许多特征来训练朴素贝叶斯分类器来对 A 或非 A 进行分类我有三个不同值类型的特征 1 total length 正整数 2 元音比率以小数分数表示 3 twoLetters lastName 包含多个两个字母字符串的数组

python27 pandas machinelearning scikitlearn NLTK

如何识别给定文本中的想法和概念

我目前正在开发一个项目如果能够检测文本正文中何时提到某个主题想法这将非常有用例如如果文本包含如果你告诉我更多关于琼斯先生的信息也许会有帮助如果我能描述一下他的外貌或者最好是一张照片也会很有用吗如果能够检测到此人索要琼斯

artificialintelligence NLP NLTK textmining

如何标准化 Wordnet 中的相似性度量

我正在尝试计算两个单词之间的语义相似度我正在使用基于 Wordnet 的相似性度量即 Resnik 度量 RES Lin 度量 LIN Jiang 和 Conrath 度量 JNC 以及 Banerjee 和 Pederson 度量 B

python NLP NLTK similarity WordNet

印地语到英语音译[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案有没有一个可以将印地语音译成英语的Python库例如应转换为 khaya 我所知道的不太蹩脚的转码器是散文 https githu

python NLP NLTK transliteration

NLTK 和语言检测

如何使用 NLTK 检测文本是用什么语言编写的我见过的例子使用nltk detect 但是当我在我的Mac上安装它时我找不到这个包您是否遇到过以下代码片段 english vocab set w lower for w in nltk

python NLP NLTK Detection

CESS_ESP 标签的定义

我正在使用NLTK http www nltk org CESS ESP 数据包我已经能够使用适应的意大利面标记器 https code google com p spaghetti tagger and a HiddenMarkovM

python NLP NLTK postagger

NLTK 将标记化句子转换为同义词集格式

我希望使用 NLTK 获得单个单词和句子中每个单词之间的相似性 NLTK可以得到两个特定单词之间的相似度如下所示此方法要求给出对该单词的具体引用在本例中为 dog n 01 其中狗是名词我们希望使用第一个 01 NLTK 定义 do

python NLTK sentimentanalysis

如何从具有字典列表的 json 将数据集加载到 pytorch torchtext.data.TabularDataset 中？

我有一个字典列表如下 text The Fulton County Grand tags AT NP TL NN TL JJ TL text The jury further said tags AT NN RBR VBD 每个字典的每个值

python Pytorch NLTK torchtext

适用于英语以外语言的 POS [重复]

这个问题在这里已经有答案了我对 nltk 很陌生这使我可以根据句子的词性来标记句子但是对于其他语言执行此操作涉及哪些步骤 import nltk sentence I m not sure tokens nltk word token

python NLTK

NLTK punkt 的训练数据格式

我想跑步nltk Punkt来分割句子没有训练模型所以我单独训练模型但我不确定我使用的训练数据格式是否正确我的训练数据是每行一个句子我找不到任何关于此的文档只有这个线程 https groups google com forum

python NLP NLTK

NLTK 荷兰语命名实体识别

我正在尝试从荷兰语文本中提取命名实体我用了nltk培训师 https github com japerk nltk trainer 在 conll2002 荷兰语语料库上训练标注器和词块划分器但是分块器的解析方法没有检测到任何命名实体

python NLP NLTK namedentityrecognition

从给定的一组单词组成一个有意义的句子[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我正在开发一个程序需要根据给定的单词集创建一个语法正确的句子在这里我将向程序传递一个字符串列表的输入我的输出应该是用这些单词和

python machinelearning neuralnetwork NLTK sentence

使用经过训练的分类器进行 NLTK 分类接口

我找到了一小块代码here http streamhacker com 2010 05 10 text classification sentiment analysis naive bayes classifier import nltk

python NLTK

使用索引查找连字符的单词

我能够得到预期的输出这本书 http victoria lviv ua html fl5 NaturalLanguageProcessingWithPython pdf 第 4 页搜索文本当我尝试将其应用于我的案例时我得到了No ma

python python3x NLTK