在爬虫中,经常要处理登陆的相关事宜,有时候登陆界面会需要提交验证码,如何处理验证码?
解决办法:若是自己编写模块,需要涉及深度学习,这就是另一块大的内容了。在这里简单调用已经封装好的模块来实现获取验证码,本文以超级鹰为例,网址:http://www.chaojiying.com
1.超级鹰的使用
(1)首先注册并登陆,来到用户中心往下拉,可以绑定微信并获得题分
(2)点击软件ID->生成一个软件ID,记住你的软件ID及Key
(3)点击开发文档->选择Python语言->点击下载
(4)解压缩后,文件夹中有一个python文件,放入你的项目中
在你编写的爬虫项目中,from chaojiying import Chaojiying_Client
2.相关代码编写
img_src = list.xpath(./a/img