Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
doc2vec 获得良好性能所需的最小数据集大小是多少?
在不同大小的数据集上进行训练时 doc2vec 的表现如何 原始语料库中没有提到数据集大小 所以我想知道从 doc2vec 中获得良好性能所需的最小大小是多少 有很多东西被称为 doc2vec 但它似乎最常指的是 Le 和 Mikolov
NLP
doc2vec
在哪里可以找到英语短语列表? [关闭]
Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我的任务是搜索文本中陈词滥调和常见短语的用法 这些短语与您在财富之轮的短语谜题中可能看到的短语类似 这
NLP
linguistics
日语/字符的编程技巧[关闭]
Closed 这个问题需要多问focused help closed questions 目前不接受答案 我有一个想法 可以编写一些网络应用程序来帮助我 也许还有其他人 更好地学习日语 因为我正在学习日语 我的问题是该网站主要是英文的 所以
javascript
languageagnostic
Unicode
NLP
cjk
AttributeError:使用 CRF 时“Tensor”对象没有属性“_keras_history”
我知道关于这个问题有很多问题 我已经阅读了其中的一些问题 但没有一个对我有用 I am trying to build a model with the following architecture 代码如下 token inputs In
tensorflow
Keras
deeplearning
NLP
namedentityrecognition
word2vec gensim 多种语言
这个问题完全超出了我的想象 我正在使用 gensim 训练 Word2Vec 模型 我提供了多种语言的数据 即英语和印地语 当我试图找到最接近 人 的词时 我得到的是 model wv most similar positive man O
python
NLP
artificialintelligence
Word2Vec
gensim
使用 nltk 中的meteor_score模块评估模型时如何实现meteor分数?
我目前有 2 个文件 reference txt 和 model txt 这两个文本文件包含原始字幕和训练后生成的字幕 我可以简单地执行以下操作来获取流星分数 score nltk translate meteor score meteor
python
NLP
NLTK
Metrics
Python 3 和 NLTK 与 WordNet 2.1 - 这可能吗?
我将 Python 3 和 NLTK 3 0 0 与 WordNet 3 0 结合使用 我想用该数据 semval2007 https github com alvations pywsd tree master pywsd data se
python
NLP
NLTK
WordNet
Keras 文本预处理 - 将 Tokenizer 对象保存到文件中以进行评分
我按照以下步骤 大致 使用 Keras 库训练了一个情感分类器模型 使用 Tokenizer 对象 类将文本语料库转换为序列 使用 model fit 方法构建模型 评估这个模型 现在 为了使用此模型进行评分 我可以将模型保存到文件中并从文
machinelearning
neuralnetwork
NLP
deeplearning
Keras
从动词列表中检索动词
我有一个全是动词的字符串列表 我需要获取每个动词的词频 但我想将 想要 想要 想要 和 想要 等动词计为一个动词 形式上 动词 被定义为 4 个单词的集合 其形式为 X Xs Xed Xing 或形式为 X Xes Xed Xing 其中
python
regex
string
list
NLP
日期自然语言解析器(.NET)?
我希望能够让用户使用自然语言 例如 下周五 每个工作日 输入日期 包括重复日期 很像以下的例子http todoist com Help timeInsert http todoist com Help timeInsert I found
NET
datetime
ironpython
NLP
我应该如何使用 scikit learn 对以下列表进行矢量化?
我想用 scikit 进行矢量化学习一个有列表的列表 我转到有训练文本的路径 我阅读了它们 然后我得到如下内容 corpus this is spam SPAM this is ham HAM this is nothing NOTHING
python
machinelearning
NLP
scikitlearn
NLTK 中的 FreqDist 未对输出进行排序
我是 Python 新手 我正在尝试自学语言处理 python 中的 NLTK 有一个名为 FreqDist 的函数 可以给出文本中单词的频率 但由于某种原因它无法正常工作 这是教程让我写的 fdist1 FreqDist text1 vo
python
NLP
NLTK
使用 NLTK python 对使用示例数据或 Web 服务的句子进行情感分析?
我正在着手一个用于情感分析的 NLP 项目 我已经成功安装了Python的NLTK 看起来是一个很棒的软件 但是 我无法理解如何使用它来完成我的任务 这是我的任务 我从一长条数据开始 假设来自他们的网络服务的数百条关于英国大选主题的推文 我
NLP
NLTK
Weka
Classification
browserify :- 未捕获类型错误:fs.readFileSync 不是函数
我试图在我的代码中使用natural js 在客户端使用它 我使用browserify 但它给出了一个错误 Uncaught TypeError fs readFileSync is not a function at loadDictio
javascript
NLP
browserify
Attention机制中的“源隐藏状态”指的是什么?
注意力权重计算如下 我想知道什么h s指 在tensorflow代码中 编码器RNN返回一个元组 encoder outputs encoder state tf nn dynamic rnn 正如我所想 h s应该是encoder sta
machinelearning
NLP
deeplearning
sequencetosequence
attentionmodel
如何获取与某个单词相关的相似单词?
我正在尝试解决一个 nlp 问题 其中我有一个单词字典 例如 list 1 phone android chair netflit charger macbook laptop sony 现在 如果输入是 phone 我可以轻松地使用 in
python
NLP
NLTK
gensim
spacy
训练新的 AutoTokenizer 拥抱脸部
收到此错误 AttributeError GPT2Tokenizer 对象没有 属性 train new from iterator 与拥抱面部文档非常相似 我更改了输入 就是这样 不应该影响它 有一次就成功了 2小时后回来查看 发现并没有
python
NLP
datascience
huggingfacetransformers
transformermodel
理解含义的算法[关闭]
很难说出这里问的是什么 这个问题是含糊的 模糊的 不完整的 过于宽泛的或修辞性的 无法以目前的形式得到合理的回答 如需帮助澄清此问题以便重新打开 访问帮助中心 help reopen questions 我想知道是否有任何特定的算法可以遵循
Algorithm
artificialintelligence
NLP
semantics
创建向量空间
我有一个问题 我有很多文档 每一行都是由某种模式构建的 当然 我有这一系列的图案 我想创建一些向量空间 然后通过某种规则来向量这个模式 我还不知道这个规则是什么 即使这个模式像我的向量空间的 质心 然后向量当前文档的每一行 再次按照此规则
python
python3x
machinelearning
NLP
jupyternotebook
当我在本地运行 CoreNLP 时,为什么“corenlp.run”会产生不同的结果?
网站corenlp run http corenlp run它应该是 CoreNLP 演示站点 显示的结果与我在本地计算机上运行 CoreNLP 管道时的结果截然不同 网站上确实显示了正确的结果 而本地机版本却没有 我想知道是否有任何接近
NLP
stanfordnlp
«
1
2
3
4
5
6
7
...44
»