Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
在 NLTK 中实现词袋朴素贝叶斯分类器
我基本上有和这个人有同样的问题 https stackoverflow com questions 2162718 python nltk code snippet to train a classifier naive bayes usi
python
machinelearning
NLP
NLTK
naivebayes
主题分布:在python中进行LDA后如何查看哪个文档属于哪个主题
我能够运行 gensim 中的 LDA 代码 并获得前 10 个主题及其各自的关键字 现在 我想进一步了解 LDA 算法的准确性 方法是查看它们将哪些文档聚类到每个主题中 这在 gensim LDA 中可能吗 基本上我想做这样的事情 但是在
python
NLTK
LDA
gensim
将 POS 标签从 TextBlob 转换为 Wordnet 兼容输入
我使用 Python 和 nltk Textblob 进行一些文本分析 有趣的是 您可以为 wordnet 添加 POS 以使同义词搜索更加具体 但不幸的是 nltk 和 Textblob 中的标记与 wordnet 对其同义词集类期望的输
python
tags
NLP
NLTK
textblob
使用正则表达式对使用“但是”一词的句子进行分块
我正在尝试使用正则表达式在 但是 一词 或任何其他协调连词 处对句子进行分块 它不起作用 sentence nltk pos tag word tokenize There are no large collections present
python
regex
NLTK
chunking
使用 WordNet 确定两个文本之间的语义相似度?
如何使用 WordNet 确定 python 中两个文本之间的语义相似度 明显的预处理是删除停用词和词干 但是然后呢 我能想到的唯一方法是计算两个文本中每个单词之间的 WordNet 路径距离 这是一元语法的标准 但这些都是大型 400 个
python
NLP
NLTK
WordNet
semanticanalysis
Python 中与语法、标记、词干和词义消歧有关的一些 NLP 内容
背景 TLDR 为了完成而提供 寻求有关奇怪需求的最佳解决方案的建议 我是一名大学四年级的 文学 学生 只有我自己的编程指导 我对Python有足够的能力 所以我不会在实现我找到的解决方案 大多数时候 并在它们的基础上进行开发时遇到麻烦 但
python
NLP
grammar
tagging
NLTK
在 Python Pandas 中训练朴素贝叶斯的不同类型的特征
我想使用许多特征来训练朴素贝叶斯分类器来对 A 或 非 A 进行分类 我有三个不同值类型的特征 1 total length 正整数 2 元音比率 以小数 分数表示 3 twoLetters lastName 包含多个两个字母字符串的数组
python27
pandas
machinelearning
scikitlearn
NLTK
如何识别给定文本中的想法和概念
我目前正在开发一个项目 如果能够检测文本正文中何时提到某个主题 想法 这将非常有用 例如 如果文本包含 如果你告诉我更多关于琼斯先生的信息 也许会有帮助 如果我能描述一下他的外貌 或者最好是一张照片 也会很有用吗 如果能够检测到此人索要琼斯
artificialintelligence
NLP
NLTK
textmining
如何标准化 Wordnet 中的相似性度量
我正在尝试计算两个单词之间的语义相似度 我正在使用基于 Wordnet 的相似性度量 即 Resnik 度量 RES Lin 度量 LIN Jiang 和 Conrath 度量 JNC 以及 Banerjee 和 Pederson 度量 B
python
NLP
NLTK
similarity
WordNet
印地语到英语音译[关闭]
Closed 这个问题需要多问focused help closed questions 目前不接受答案 有没有一个可以将印地语音译成英语的Python库 例如 应转换为 khaya 我所知道的不太蹩脚的转码器是散文 https githu
python
NLP
NLTK
transliteration
NLTK 和语言检测
如何使用 NLTK 检测文本是用什么语言编写的 我见过的例子使用nltk detect 但是当我在我的Mac上安装它时 我找不到这个包 您是否遇到过以下代码片段 english vocab set w lower for w in nltk
python
NLP
NLTK
Detection
CESS_ESP 标签的定义
我正在使用NLTK http www nltk org CESS ESP 数据包 我已经能够使用适应 的意大利面标记器 https code google com p spaghetti tagger and a HiddenMarkovM
python
NLP
NLTK
postagger
NLTK 将标记化句子转换为同义词集格式
我希望使用 NLTK 获得单个单词和句子中每个单词之间的相似性 NLTK可以得到两个特定单词之间的相似度 如下所示 此方法要求给出对该单词的具体引用 在本例中为 dog n 01 其中狗是名词 我们希望使用第一个 01 NLTK 定义 do
python
NLTK
sentimentanalysis
如何从具有字典列表的 json 将数据集加载到 pytorch torchtext.data.TabularDataset 中?
我有一个字典列表如下 text The Fulton County Grand tags AT NP TL NN TL JJ TL text The jury further said tags AT NN RBR VBD 每个字典的每个值
python
Pytorch
NLTK
torchtext
适用于英语以外语言的 POS [重复]
这个问题在这里已经有答案了 我对 nltk 很陌生 这使我可以根据句子的词性来标记句子 但是对于其他语言执行此操作涉及哪些步骤 import nltk sentence I m not sure tokens nltk word token
python
NLTK
NLTK punkt 的训练数据格式
我想跑步nltk Punkt来分割句子 没有训练模型 所以我单独训练模型 但我不确定我使用的训练数据格式是否正确 我的训练数据是每行一个句子 我找不到任何关于此的文档 只有这个线程 https groups google com forum
python
NLP
NLTK
NLTK 荷兰语命名实体识别
我正在尝试从荷兰语文本中提取命名实体 我用了nltk培训师 https github com japerk nltk trainer 在 conll2002 荷兰语语料库上训练标注器和词块划分器 但是 分块器的解析方法没有检测到任何命名实体
python
NLP
NLTK
namedentityrecognition
从给定的一组单词组成一个有意义的句子[关闭]
Closed 这个问题需要多问focused help closed questions 目前不接受答案 我正在开发一个程序 需要根据给定的单词集创建一个语法正确的句子 在这里 我将向程序传递一个字符串列表的输入 我的输出应该是用这些单词和
python
machinelearning
neuralnetwork
NLTK
sentence
使用经过训练的分类器进行 NLTK 分类接口
我找到了一小块代码here http streamhacker com 2010 05 10 text classification sentiment analysis naive bayes classifier import nltk
python
NLTK
使用索引查找连字符的单词
我能够得到预期的输出这本书 http victoria lviv ua html fl5 NaturalLanguageProcessingWithPython pdf 第 4 页 搜索文本 当我尝试将其应用于我的案例时 我得到了No ma
python
python3x
NLTK
«
1 ...
3
4
5
6
7
8
9
...14
»