在文本页面中,我想检查每个单词。当时阅读每个单词的最佳方式是什么?找到被空格包围的单词很容易,但是一旦你开始解析文本中的单词,它就会变得复杂。
是否有一些已经构建的东西可以解析正则表达式或其他方法中的单词,而不是定义我自己的从文本中解析单词的方式?
文本中单词的一些示例。
word word. word(word) word's word word' "word" .word. 'word' sub-word
您可以使用:
text = "word word. word(word) word's word word' \"word\" .word. 'word' sub-word";
words = text.match(/[-\w]+/g);
这将为您提供一个包含所有单词的数组。
在正则表达式中,\w
表示任何字符a-z
, A-Z
, 0-9
or _
. [-\w]
表示任何一个字符\w
or a -
. [-\w]+
表示这些字符中的任何一个出现 1 次或以上。
如果您想将一个单词定义为除上述表达式之外的其他内容,请在表达式中添加组成单词的其他字符[-\w]
字符类。例如,如果您希望单词还包含(
and )
,使字符类为[-\w()]
.
有关正则表达式的介绍,请查看以下精彩教程:正则表达式.info http://www.regular-expressions.info/tutorial.html.
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)