我正在尝试使用 urllib2 打开页面,但我不断收到连接超时错误。
我正在使用的线路是:f = urllib2.urlopen(url)
确切的错误是:
URLError: <urlopen error [Errno 110] Connection timed out>
urllib2
尊重 robots.txt。许多网站阻止默认设置User-Agent
.
尝试添加一个新的User-Agent
,通过创建Request
对象并使用它们作为参数urlopen
:
import urllib2
request = urllib2.Request('http://www.example.com/')
request.add_header('User-agent', 'Mozilla/5.0 (Linux i686)')
response = urllib2.urlopen(request)
有几个详细的演练可供使用,例如http://www.doughellmann.com/PyMOTW/urllib2/ http://www.doughellmann.com/PyMOTW/urllib2/
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)