Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
将列表的列表转换为字符串 pandas dataframe
背景 我有以下玩具df包含列中的列表Before and After如下所示 import pandas as pd before list in the bright blue box list because they go reall
python3x
pandas
DataFrame
NLP
nestedlists
在 Keras IMDB 示例中使用字符串作为输入
我正在看Keras IMDB 电影评论情感分类示例 https keras io datasets imdb movie reviews sentiment classification 以及github上对应的模型 https githu
tensorflow
machinelearning
NLP
Keras
tensorflowserving
如何从 CoNLL 格式转换为 spacy 格式
我目前正在研究 NER 模型 我有一堆以 CoNLL 格式存储的数据 需要转换为 Spacy 格式 在 CoNLL 中 句子的每个单词旁边都有一个标签 在 Spacy 中 标签仅显示给具有实际标签的单词 我如何从下面的这种格式转换 CoNL
python
database
NLP
spacy
namedentityrecognition
BERT 问答中长文本的滑动窗口
我读过解释滑动窗口如何工作的帖子 但我找不到有关其实际实现方式的任何信息 据我了解 如果输入太长 可以使用滑动窗口来处理文本 如果我错了 请纠正我 说我有一条短信 2017 年 6 月 Kaggle 宣布注册用户突破 100 万 给定一些s
虚假评论数据集
互联网上有包含常见垃圾邮件的数据集 但我需要包含虚假评论的数据集来进行一些研究 但我找不到任何数据集 有人能给我关于在哪里可以获得虚假评论数据集的建议吗 我们的数据集可以在我的康奈尔大学主页上找到 http www cs cornell e
NLP
spam
review
corpus
使用 NLTK 和德语语料库从名词获取性别
我正在尝试 NTLK 我的问题是图书馆是否可以检测德语名词的性别 我想接收此信息以确定文本是否是性别中立的 浏览此处获取更多信息 https en wikipedia org wiki Gender neutrality in langua
python
NLP
NLTK
如何计算2个node2vec模型之间的距离
我有 2 个不同时间戳的 node2vec 模型 我想计算两个模型之间的距离 两个模型具有相同的词汇 我们更新模型 我的模型是这样的 model1 1 0 1 0 5 2 0 3 0 4 3 0 2 0 5 model2 1 0 15 0
python
Graph
NLP
Word2Vec
AttributeError:模块“jaxlib.xla_extension”没有属性“PmapFunction”
有人可以帮我修复在 check not jax transformed f 中的 usr local lib python3 7 dist packages haiku src transform py in check not jax t
python
NLP
jax
将中文文档拆分成句子[关闭]
Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我必须将中文文本分成多个句子 我尝试了斯坦福文档预处理器 它对于英语来说效果很好 但对于中文则不然 请
NLP
tokenize
stanfordnlp
sentence
在哪里可以找到详尽的停用词列表?
我在哪里可以找到详尽的停用词列表 我的那篇文章很短 似乎不适用于科学文本 我正在创建词汇链以从科学论文中提取关键主题 问题是像这样的词based regarding等也应被视为停用词 因为它们没有太多意义 您还可以轻松添加到现有的停用词列表
NLP
lexicalanalysis
stopwords
Spacy - 标记带引号的字符串
我正在使用 spacy 2 0 并使用带引号的字符串作为输入 示例字符串 The quoted text AA XX should be tokenized 并期望提取 The quoted text AA XX should be tok
python3x
NLP
spacy
NLTK 中解析的英语语法
是否有现成的英语语法可供我加载并在 NLTK 中使用 我搜索了使用 NLTK 进行解析的示例 但似乎我必须在解析句子之前手动指定语法 多谢 你可以看一下pyStat解析器 https github com emilmont pyStatPa
python
NLP
grammar
NLTK
如何从NLP Tree中提取元素?
我正在使用NLP包来解析句子 我怎样才能从Tree创建的输出 例如 我想抓住名词短语 NP 来自下面的示例 library NLP library openNLP s lt c Really I like chocolate because
r
NLP
opennlp
对停用词进行标记,生成的标记 ['ha', 'le', 'u', 'wa'] 不在 stop_words 中
我正在使用 Python 制作一个聊天机器人 代码 import nltk import numpy as np import random import string f open home hostbooks ML stewy spee
python
python3x
NLP
NLTK
Chatbot
使用 nltk 没有上下文的词性标记
有没有一种简单的方法来确定给定单词最可能的词性标签没有上下文使用nltk 或者如果不使用任何其他工具 数据集 我尝试使用 wordnet 但似乎 sysnet 不是按可能性排序的 gt gt gt wn synsets says Synse
python
NLP
NLTK
如何开始信息提取?
您能否推荐一个培训路径来开始并变得非常擅长信息提取 我开始阅读它是为了做我的一个爱好项目 很快意识到我必须擅长数学 代数 统计 概率 我读过一些关于不同数学主题的入门书籍 而且非常有趣 寻找一些指导 请帮忙 更新 只是为了回答其中一条评论
Math
machinelearning
NLP
informationextraction
如何在 python nltk 中获取 n-gram 搭配和关联?
In 本文档 http nltk googlecode com svn trunk doc howto collocations html 有一个例子使用nltk collocations BigramAssocMeasures Bigra
python
NLP
NLTK
NGram
collocation
在python中检测文本中的缩写
我想在文本中找到缩写并将其删除 我目前正在做的是识别连续的大写字母并将其删除 但我发现它并没有删除缩写 例如MOOCs M O O C M O O Cs 在 python 中是否有一种简单的方法可以做到这一点 或者有什么库可以代替吗 The
python
NLP
CBOW 与Skip-gram:为什么要颠倒上下文和目标词?
In this https www tensorflow org versions r0 9 tutorials word2vec index html vector representations of words页面上 据说 skip
NLP
tensorflow
deeplearning
Word2Vec
wordembedding
元音计数顺序
这不是一个家庭作业问题 而是一个考试准备问题 我应该定义一个函数syllables word 计算音节数 一句话如下 元音的最大序列是一个音节 最终e在一个单词中不是一个音节 或者它是元音序列的一部分 的 我不必处理任何特殊情况 例如最终的
python
regex
NLP
«
1 ...
5
6
7
8
9
10
11
...45
»