我正在尝试从一个带有路线的文件中获取信息,因此对于这项工作,我选择了正则表达式,但我遇到了重复信息的问题,为了做一个更好的问题,我将把我拥有的内容和我想要的内容放在一起:
所以我有一个文件:
Codes: C - Connected, S - Static, R - RIP, B - BGP,
O - OSPF IntraArea (IA - InterArea, E - External, N - NSSA)
A - Aggregate, K - Kernel Remnant, H - Hidden, P - Suppressed,
U - Unreachable, i - Inactive
O E 0.0.0.0/0 via 10.140, bond1.30, cost 1:10, age 5
via 10.141, bond1.31
via 10.142, bond1.32
O E 10.112/23 via 10.140, bond1.30, cost 46:1, age 2511
O E 10.112/23 via 10.140, bond1.30, cost 46:1, age 2511
O IA 10.138/29 via 10.140, bond1.30, cost 46, age 1029440
C 10.141/29 is directly connected, bond2.35
C 10.141/29 is directly connected, bond2.35
我做了这个正则表达式:
(S|R|B|O|A|K|H|P|U|i) +(IA|E|N|) +([0-9.]+)\/([0-9]+) +via +([0-9.]+), +([a-zA-Z0-9.]+|), +cost +([0-9]+:|)([0-9]+), +age +[0-9]+ +\n(( +via +([0-9.]+), +([a-zA-Z0-9.]+|) +\n)+|)
我的问题是结尾部分(( +via +([0-9.]+), +([a-zA-Z0-9.]+|) +\n)+|)
因为这个正则表达式给了我这个
array[0]=>' via 10.141, bond1.31
via 10.142, bond1.32';
array[1]=>'10.142';
array[2]=>'bond1.32';
但我想得到
array[0]=>'10.141';
array[1]=>'bond1.31';
array[3]=>'10.142';
array[4]=>'bond1.32';
我在有关正则表达式的页面中测试了正则表达式,其中之一告诉我这一点:
注意:重复捕获组将仅捕获最后一次迭代。
在重复组周围放置一个捕获组以捕获所有
迭代或使用非捕获组来代替(如果您不这样做)
对数据感兴趣
但我真的不知道这是什么意思以及如何解决它。
注意:这是为了获取有关 cisco 中的路由的文件show ip route
UPDATE 1
我将我的正则表达式更改为
(S|R|B|O|A|K|H|P|U|i) +(IA|E|N|) +([0-9.]+)\/([0-9]+) +via +([0-9.]+), +([a-zA-Z0-9.]+|), +cost +([0-9]+:|)([0-9]+), +age +[0-9]+ +\n(?: +via +([0-9.]+), +([a-zA-Z0-9.]+|) +\n)*
这样我就没有
array[0]=>' via 10.141, bond1.31
via 10.142, bond1.32';
但我没有重复的部分