背景
今天刷到一则文章,就是国内某富豪花重金迎娶泰国某**皇后!
可谓是有点颠覆了我的三观啊。有钱人都玩的这么花的吗?这里内容就不一一讲了,毕竟看咱文章的都是想来学技术的!那就废话不多说,开始干活!
正文
相关模块
今天不用其他的什么模块
python3.8
pycharm
一个用来进行数据可视化的模块
jupyter notebook
这里重点
由于很多观看文章的小伙伴都是新手,可能对爬虫不是很了解,所以这里多讲一点!
爬虫知识点:
requests简单使用 get方法 获取数据
re模块简单使用 .*?
csv 保存数据
基础知识点:
数据类型转换 --> json字典数据
列表取值
字典创建/取值
for循环遍历
print输出函数
pprint格式化输出模块的使用
函数关键字传参
这样就对怎么去爬取数据能有个清晰的认知了吧
干货
由于爬取的内容网站非常的简单,这个应该学了两天爬虫的都会!主要还是看咱们的代码,跟着代码来应该就能搞定它了,对了,后面还有个数据可视化!思路都一样,这里也偷个小懒,嘿嘿,就不过多的讲解今天的思路了!如果实在有不会的,