我已经搜索了至少 2 小时,但找不到任何使用正则表达式提取以下 URL 的模式。我采用了很多文章中描述的太多模式。但我找不到有用的东西。
例如: URL 类似于以下模式。
http://google.com
http://www.google.com
http://www.image.google.com
http://google.com:8080
http://google.com:8080/default.aspx?param=1
http://google.com/default.aspx?param=1¶m1=2
Update :亲爱的朋友,看来我必须更详细地解释我的问题,我正在使用 TCP 组件开发一个简单的代理服务器,我的服务器在收到传入连接时侦听特定端口。我正在提取并读取所有客户端请求数据。
数据包含标题和内容类型等,如下所示:
GET http://www.bing.com/ HTTP/1.1
Accept: text/html, application/xhtml+xml, */*
Accept-Language: en-US,en;q=0.7,fa;q=0.3
User-Agent: Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.2; WOW64; Trident/6.0)
Accept-Encoding: gzip, deflate
Host: www.bing.com
DNT: 1
Proxy-Connection: Keep-Alive
这些是纯文本,因此我需要查找并提取 URL 来执行转发操作。
以及您猜到的任何 URL 模式。
请,任何建议都会有所帮助。
https?://[\w\.]+\.\w+(:\d{1,5})?(/[\w?&.=]+)?
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)