NLP

运行时错误：CUDA 错误：设备端断言已触发 - 训练 LayoutLMV3 时

我正在训练最新版本的layoutLMv3模型但在开始训练时trainer train 出现以下错误请帮我解决它我使用的是 v100 4 GPU RuntimeError Traceback most recent call last

python Algorithm NLP Pytorch huggingfacetransformers

C++ - 如何使用 C++ 读取 Unicode 字符（例如印地语脚本），或者是否有通过其他编程语言更好的方法？

我有一个像这样的印地语脚本文件 3 我必须编写一个程序为每个句子中的每个单词添加一个位置因此特定单词位置的每一行的编号应以括号中的 1 开头输出应该是这样的 3 1 2 3 4 5 6 7 8 9 上面这句话的意思是 3 India

c UTF8 NLP

如何使用CNN来训练不同大小的输入数据？

CNN 似乎主要针对固定大小的输入来实现现在我想用CNN来训练一些不同大小的句子有哪些常用的方法以下建议主要与用于计算机视觉任务特别是识别的 CNN 相关但也可能对您的领域有所帮助我会看看He 等人的用于视觉识别的深度卷积网

machinelearning NLP deeplearning

有什么工具可以以编程方式将日语句子转换为其罗马字（语音阅读）？ [关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案 Input 日本好 Output 日本 ga sukidesu 遗憾的是无法通过 Google Translate API 进行语音阅读 KAKA

Unicode NLP translation cjk

如何从另一种语言单词创建英文字母字符串？

我需要找到一种方法将某些语言的单词翻译重写为英语例如俄语听起来像privet 用英语讲含义和语法并不重要但我希望它听起来更相似一切都应该用Python编写我在网上努力查找但没有找到好的方法例如类似这样的事情 tran

python NLP NLTK translation

如何在keras中使用Bert作为长文本分类中的段落编码器来实现网络？

我正在做一个长文本分类任务文档中有超过 10000 个单词我计划使用 Bert 作为段落编码器然后将段落的嵌入逐步输入 BiLSTM 网络如下输入 batch size max paragraph len max tokens pe

python Keras NLP bertlanguagemodel

在 python 中快速/优化 N-gram 实现

python 中哪种 ngram 实现速度最快我试图分析 nltk 与 scott 的 zip http locallyoptimal com blog 2013 01 20 elegant n gram Generation in py

python NLP NLTK informationretrieval NGram

添加对 CountVectorizer (sklearn) 的词干支持

我正在尝试使用 sklearn 将词干添加到 NLP 中的管道中 from nltk stem snowball import FrenchStemmer stop stopwords words french stemmer French

python NLP scikitlearn

波特油炸的去梗

为什么波特词干算法在线 http text processing com demo stem http text processing com demo stem stem fried to fri并不是fry 我不记得任何以以下结尾的单词

NLP NLTK stemming porterstemmer

改进现有的基本 GloVe 模型

我正在使用 GloVe 作为我研究的一部分我已经从以下位置下载了模型here https nlp stanford edu projects glove 我一直在使用 GloVe 进行句子分类我正在分类的句子特定于特定领域例如某些 S

NLP textclassification GloVe

如何计算两个单词之间的相似度以检测它们是否重复？

我有两个单词我想计算它们之间的相似度以便对它们是否重复进行排名如何使用深度学习 NLP 方法实现这一目标这里有一些解决文本相似性的方法基于字符串的方法给定 2 个句子字符串计算余弦相似度 https stackoverflow

python deeplearning NLP similarity

将三元组、二元组和一元组与文本匹配；如果一元或二元是已经匹配的三元的子串，则通过； Python

main text 是包含已被词性标记的句子的列表的列表 main text the DT mad JJ hatter NN likes VB tea NN and CC hats NN the DT red JJ queen NN hat

python NLP textprocessing

在 NLTK 3.0 中使用 Wordnet 从 Synset 中提取单词

前段时间 SO上有人问如何检索给定同义词集的单词列表 https stackoverflow com questions 24664250 how do i print out just the word itself in a wordn

python NLP NLTK WordNet

从复杂（混合）句子中提取简单句子的算法？

有没有一种算法可以用来从段落中提取简单的句子我的最终目标是稍后对生成的简单句子运行另一个算法来确定作者的情绪我已经从 Chae Deug Park 等来源对此进行了研究但没有讨论准备简单的句子作为训练数据提前致谢看一眼Apache

NLP extract textmining textextraction informationextraction

自动同义词检测方法

我目前正在研究一种基于神经网络的短文档分类方法由于我正在使用的语料库通常在十个单词左右因此标准统计文档分类方法的用途有限因此我正在尝试对训练中提供的匹配实施某种形式的自动同义词检测更具体地说我的问题是关于解决以下情况假设我有

如何在张量流中使用非常大（>2M）的词嵌入？

我正在运行一个具有非常大的词嵌入 gt 2M 词的模型当我使用 tf embedding lookup 时它需要一个很大的矩阵当我运行时我随后出现了 GPU 内存错误如果我减小嵌入的大小一切都会正常有没有办法处理更大的嵌入

tensorflow NLP deeplearning Embedding embeddinglookup

如何在javascript中动态构建json数组

我从 wit ai 收到一个 json 对象其中包含一些快速回复元素如下所示 msg So glad to have you back What do you want me to do action id 6fd7f2bd db67

javascript nodejs facebook NLP witai

如何使用斯坦福NER（命名实体识别器）的python接口？

我想使用 pyner 库在 python 中使用斯坦福 NER 这是一个基本的代码片段 import ner tagger ner HttpNER host localhost port 80 tagger get entities Uni

python27 NLP stanfordnlp namedentityrecognition

NLP 中的否定处理

我目前正在开发一个项目我想从文本中提取情感由于我使用的是conceptnet5 一种语义网络因此我不能简单地在包含否定词的句子中添加单词前缀因为这些单词根本不会出现在conceptnet5 的API 中这是一个例子这部电影不太好

python regex NLP NLTK textprocessing

基于WordNet测量语义相似度，Brown Corpus有什么用

我遇到了几种使用 WordNet 的结构和层次结构来测量语义相似性的方法例如Jiang and Conrath测度 JNC Resnik测度 RES 林测度 LIN 等使用 NLTK 测量它们的方式是 sim2 wn jcn simil

NLP similarity WordNet corpus semanticanalysis