好吧,一方面,您正在用一堆不必要的管道字符填充字符集 - 交替隐含在[]
一对。额外的清理:+
不需要在字符类中转义。你的正则表达式似乎正在解决比你给我们的更大的问题陈述 - 你没有提到d
or D
作为可匹配的字符。并且您已经将正则表达式的整个后半部分变成了可选的。根据我认为您最初的问题陈述,我构建了以下正则表达式:
^\s*([+-]?\d{1,3}\*?\s+\d{1,2}'?\s+\d{1,2}"?[NSEW]?|\d{1,3}(:\d{2}){2}\.\d[NSEW]\s*){1,2}$
这有点奇怪,但我会为你或将来遇到这种情况的任何人分解它(你好,未来!)。
^
字符串的开头,简单。
\s*
任意数量的空白 - 甚至没有。
(
表示组的开始——我们稍后会讨论这一点。
[-+]?
可选标志
\d{1,3}
1 到三位数
\*?
可选的星号 - 此处的转义符是星号的关键,但如果您想将其替换为实际学位的 unicode 代码点,则不需要它。
\s+
至少有一个空格字符
\d{1,2}
1 或 2 位数字。
'?
可选的撇号
\s+\d{1,2}+
你以前见过这些,但有一个新的曲线球 - 在后面有一个加号{1,2}
量词!这使其成为所有格量词,这意味着匹配器不会放弃该组的比赛来使另一组成为可能。这几乎完全是为了防止1 1 11 1 1
匹配,但可用于在您 100% 确定不需要回溯的任何地方提高速度。
"?
可选双引号。在 Java 中你必须避免这种情况。
[NSEW]?
可选的基本方向,由字母指定
|
或者 - 您可以匹配此之前组中的所有内容,或此之后组中的所有内容。
\d{1,3}
老新闻了。
(:\d{2})
一个冒号,后跟两个字符...
{2}
twice!
\.\d
小数点后跟一位数字。
[NSEW]
和以前一样,但这次是强制性的。
\s*)
一些空间,终于结束了这个小组。现在,第一组已匹配整个经度/纬度表示,末尾有任意数量的空格。紧随其后的是:
{1,2}
这样做一次或两次 - 匹配一个或一对,最后:
$
字符串的末尾。
这并不完美,但非常接近,而且我认为它回答了最初的问题陈述。另外,我觉得我的解释已经足够揭开它的神秘面纱,您可以对其进行编辑以进一步满足您的需求。它没有(也不会)做的一件事是强制第一个坐标与第二个坐标的样式相匹配。对正则表达式的要求实在是太高了。
怀疑者:这是在行动 http://regexr.com?32vj8。请享受。