Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
将段落拆分为带有标题和编号的句子
我正在使用 Java 中的 BreakIterator 类将段落分成句子 这是我的代码 public Map
Java
textsegmentation
当输入句子没有标点符号时使用的句子分割工具(已标准化)
假设有一个类似 给我找一些爵士音乐并播放它 的句子 其中所有文本都已标准化并且没有标点符号 语音识别库的输出 除了连接词分割的简单方法之外 还有哪些在线 离线工具可用于进行 句子分割 Input 给我找一些爵士乐并播放 Output 给我找
NLP
textsegmentation
正则表达式匹配句子中的第一个单词
我正在寻找一个正则表达式 它匹配句子中的第一个单词 不包括标点符号和空格 例如 这是一个句子 中的 这个 和 首先 我想说 你好 中的 第一 这不起作用 A Z A Za z r s w 将匹配每个句子中的第一个单词 http rubula
regex
textsegmentation
在句子边界分割文本文件
我必须处理一个文本文件 一本电子书 我想对其进行处理 以便每行有一个句子 换行符分隔的文件 是吗 我如何使用 UNIX 实用程序 sed 来完成此任务 它是否有一个 句子边界 的符号 就像 单词边界 的符号一样 我认为 GNU 版本有这个
c
sed
NLP
textsegmentation
PHP中如何获取一个句子的第一个单词?
我想从字符串中提取变量的第一个单词 例如 采用以下输入 结果输出应该是Test 这是输入的第一个单词 我怎样才能做到这一点 有一个字符串函数 strtok http php net strtok 可用于将字符串拆分为更小的字符串 token
php
string
extract
textsegmentation
使用python提取一个句子
如果该句子中存在特定单词 我想提取确切的句子 谁能告诉我如何用 python 做到这一点 我使用了 concordance 但它只打印单词匹配的行 快速提醒一下 断句实际上是一件非常复杂的事情 句号规则也有例外 例如 先生 或 博士 还有各
python
textsegmentation
在 PHP 中将段落分解为句子
我一直在使用 explode mystring 将段落拆分成句子 然而 这不包括用不同标点符号结束的句子 例如 有没有办法使用数组而不是单个字符作为分隔符 或者还有另一种使用各种标点符号进行拆分的巧妙方法吗 I tried explode
php
string
explode
textsegmentation
NLP 中的英语分词?
我是 NLP 领域的新手 但我目前的研究需要从 URL 地址进行一些文本解析 或称为关键字提取 例如虚假网址 http ads goole com appid heads 我的解析有两个限制 第一个 ads 和最后一个 heads 应该不同
Web
NLP
textsegmentation
独立子句边界消歧和独立子句分段——有什么工具可以做到这一点吗?
我记得很久以前浏览过 NLTK 网站的句子切分部分 我使用 句号 空格 的粗文本替换为 句号 手动换行符 来实现句子切分 例如使用 Microsoft Word 替换 gt p 或 Chrome 扩展程序 https github com
NLP
textsegmentation
如何通过字符串中的单个单词匹配来提取整个句子?
所以我有一个完整的字符串 大约 10k 个字符 然后在该字符串中搜索一个单词 或多个单词 和regex word Matches scrappedstring 但如何提取包含该单词的整个句子 我正在考虑在搜索的单词后面取一个子字符串 直到第
c
NET
regex
string
textsegmentation
如何使用 NLP 将非结构化文本内容分成不同的段落?
以下非结构化文本具有三个不同的主题 史泰龙 费城和美国革命 但是您会使用哪种算法或技术将这些内容分成不同的段落 分类器在这种情况下不起作用 我还尝试使用 Jaccard 相似度分析器来查找连续句子之间的距离 并尝试在连续句子之间的距离小于给
Text
NLP
Classification
clusteranalysis
textsegmentation
如何将字符串拆分为单词列表?
如何拆分句子并将每个单词存储在列表中 例如 these are words these are words To split on other delimiters see Split a string by a delimiter in
python
string
list
split
textsegmentation
如何将句子分成单词和标点符号?
例如 我想拆分这句话 I am a sentence 变成一个由 5 部分组成的数组 I am a sentence and 我目前正在使用preg split尝试后explode 但我似乎找不到合适的东西 这是我尝试过的 sentence
php
regex
string
pregsplit
textsegmentation
将句子拆分为单词
例如我有这样的句子 text word word w d word 我需要这样的数组 Array 0 gt word 1 gt word 2 gt w d 3 gt word 我对正则表达式很陌生 这是我尝试过的 function divi
php
textsegmentation
自动保存分割结果 - Matlab 阿拉伯语 OCR
完整的分割代码 Preprocessing Segmentation Original Code of Segmentation by Soumyadeep Sinha with several modification by Ana Sa
MATLAB
OCR
arabic
textsegmentation
某些象形文字语言中的字计数器?
是否有任何可用的库用于某些象形文字语言的字数统计 例如 中文 日文 韩文 我发现 MS Word 可以有效地计算这些语言的文本 我可以在 NET 应用程序中添加对 MS Word 库的引用来实现此功能吗 或者还有其他解决方案可以达到这个目的
c
msword
wordcount
textsegmentation
如何将句子中第一个单词的第一个字母大写?
我正在尝试编写一个函数来清理用户输入 我并不想让它变得完美 我宁愿有几个小写的名字和缩写 也不愿有一个完整的大写段落 我认为该函数应该使用正则表达式 但我对这些非常不熟悉 我需要一些帮助 如果以下表达式后跟一个字母 我想将该字母设为大写 f
php
regex
userinput
textsegmentation
php句子边界检测[重复]
这个问题在这里已经有答案了 我想用 PHP 将文本分成句子 我目前正在使用正则表达式 它的准确率约为 95 并且希望通过使用更好的方法来改进 我见过用 Perl Java 和 C 实现此目的的 NLP 工具 但没有看到任何适合 PHP 的工
php
regex
NLP
textsegmentation