Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
运行时错误:CUDA 错误:设备端断言已触发 - 训练 LayoutLMV3 时
我正在训练最新版本的layoutLMv3模型 但在开始训练时trainer train 出现以下错误 请帮我解决它 我使用的是 v100 4 GPU RuntimeError Traceback most recent call last
python
Algorithm
NLP
Pytorch
huggingfacetransformers
C++ - 如何使用 C++ 读取 Unicode 字符(例如印地语脚本),或者是否有通过其他编程语言更好的方法?
我有一个像这样的印地语脚本文件 3 我必须编写一个程序 为每个句子中的每个单词添加一个位置 因此 特定单词位置的每一行的编号应以括号中的 1 开头 输出应该是这样的 3 1 2 3 4 5 6 7 8 9 上面这句话的意思是 3 India
c
UTF8
NLP
如何使用CNN来训练不同大小的输入数据?
CNN 似乎主要针对固定大小的输入来实现 现在我想用CNN来训练一些不同大小的句子 有哪些常用的方法 以下建议主要与用于计算机视觉任务 特别是识别 的 CNN 相关 但也可能对您的领域有所帮助 我会看看He 等人的 用于视觉识别的深度卷积网
machinelearning
NLP
deeplearning
有什么工具可以以编程方式将日语句子转换为其罗马字(语音阅读)? [关闭]
Closed 这个问题是无关 help closed questions 目前不接受答案 Input 日本 好 Output 日本 ga sukidesu 遗憾的是 无法通过 Google Translate API 进行语音阅读 KAKA
Unicode
NLP
translation
cjk
如何从另一种语言单词创建英文字母字符串?
我需要找到一种方法将某些语言的单词 翻译 重写为英语 例如 俄语 听起来像privet 用英语讲 含义和语法并不重要 但我希望它听起来更相似 一切都应该用Python编写 我在网上努力查找 但没有找到好的方法 例如 类似这样的事情 tran
python
NLP
NLTK
translation
如何在keras中使用Bert作为长文本分类中的段落编码器来实现网络?
我正在做一个长文本分类任务 文档中有超过 10000 个单词 我计划使用 Bert 作为段落编码器 然后将段落的嵌入逐步输入 BiLSTM 网络如下 输入 batch size max paragraph len max tokens pe
python
Keras
NLP
bertlanguagemodel
在 python 中快速/优化 N-gram 实现
python 中哪种 ngram 实现速度最快 我试图分析 nltk 与 scott 的 zip http locallyoptimal com blog 2013 01 20 elegant n gram Generation in py
python
NLP
NLTK
informationretrieval
NGram
添加对 CountVectorizer (sklearn) 的词干支持
我正在尝试使用 sklearn 将词干添加到 NLP 中的管道中 from nltk stem snowball import FrenchStemmer stop stopwords words french stemmer French
python
NLP
scikitlearn
波特 油炸的去梗
为什么波特词干算法在线 http text processing com demo stem http text processing com demo stem stem fried to fri并不是fry 我不记得任何以以下结尾的单词
NLP
NLTK
stemming
porterstemmer
改进现有的基本 GloVe 模型
我正在使用 GloVe 作为我研究的一部分 我已经从以下位置下载了模型here https nlp stanford edu projects glove 我一直在使用 GloVe 进行句子分类 我正在分类的句子特定于特定领域 例如某些 S
NLP
textclassification
GloVe
如何计算两个单词之间的相似度以检测它们是否重复?
我有两个单词 我想计算它们之间的相似度 以便对它们是否重复进行排名 如何使用深度学习 NLP 方法实现这一目标 这里有一些解决文本相似性的方法 基于字符串的方法 给定 2 个句子字符串计算余弦相似度 https stackoverflow
python
deeplearning
NLP
similarity
将三元组、二元组和一元组与文本匹配;如果一元或二元是已经匹配的三元的子串,则通过; Python
main text 是包含已被词性标记的句子的列表的列表 main text the DT mad JJ hatter NN likes VB tea NN and CC hats NN the DT red JJ queen NN hat
python
NLP
textprocessing
在 NLTK 3.0 中使用 Wordnet 从 Synset 中提取单词
前段时间 SO上有人问如何检索给定同义词集的单词列表 https stackoverflow com questions 24664250 how do i print out just the word itself in a wordn
python
NLP
NLTK
WordNet
从复杂(混合)句子中提取简单句子的算法?
有没有一种算法可以用来从段落中提取简单的句子 我的最终目标是稍后对生成的简单句子运行另一个算法来确定作者的情绪 我已经从 Chae Deug Park 等来源对此进行了研究 但没有讨论准备简单的句子作为训练数据 提前致谢 看一眼Apache
NLP
extract
textmining
textextraction
informationextraction
自动同义词检测方法
我目前正在研究一种基于神经网络的短文档分类方法 由于我正在使用的语料库通常在十个单词左右 因此标准统计文档分类方法的用途有限 因此 我正在尝试对训练中提供的匹配实施某种形式的自动同义词检测 更具体地说 我的问题是关于解决以下情况 假设我有
如何在张量流中使用非常大(>2M)的词嵌入?
我正在运行一个具有非常大的词嵌入 gt 2M 词 的模型 当我使用 tf embedding lookup 时 它需要一个很大的矩阵 当我运行时 我随后出现了 GPU 内存错误 如果我减小嵌入的大小 一切都会正常 有没有办法处理更大的嵌入
tensorflow
NLP
deeplearning
Embedding
embeddinglookup
如何在javascript中动态构建json数组
我从 wit ai 收到一个 json 对象 其中包含一些快速回复元素 如下所示 msg So glad to have you back What do you want me to do action id 6fd7f2bd db67
javascript
nodejs
facebook
NLP
witai
如何使用斯坦福NER(命名实体识别器)的python接口?
我想使用 pyner 库在 python 中使用斯坦福 NER 这是一个基本的代码片段 import ner tagger ner HttpNER host localhost port 80 tagger get entities Uni
python27
NLP
stanfordnlp
namedentityrecognition
NLP 中的否定处理
我目前正在开发一个项目 我想从文本中提取情感 由于我使用的是conceptnet5 一种语义网络 因此我不能简单地在包含否定词的句子中添加单词前缀 因为这些单词根本不会出现在conceptnet5 的API 中 这是一个例子 这部电影不太好
python
regex
NLP
NLTK
textprocessing
基于WordNet测量语义相似度,Brown Corpus有什么用
我遇到了几种使用 WordNet 的结构和层次结构来测量语义相似性的方法 例如Jiang and Conrath测度 JNC Resnik测度 RES 林测度 LIN 等 使用 NLTK 测量它们的方式是 sim2 wn jcn simil
NLP
similarity
WordNet
corpus
semanticanalysis
«
1
2
3
4
5
6
7
8
...44
»