#!/usr/bin/env python
# -*- coding:utf-8 -*-
#@author:Chris iven
#Python version 3.6
#1.分析LOL官网行为!
#发现这个网页的所有数据都是经过js生成的!意思就是说 他的数据全部不在该网页里面,而是在一个JS文件里面!
#所以我们只需要获取JS数据.
"""
抓取步骤及思路:
1.获取英雄的js数据,访问并且下载.然后转换为JSON格式的数据.
2.对数据进行解析,我们这边的函数式get_hero_data!
这个函数会对下载的json数据进行解析,提取出LOL中的英雄英文名字和id值!
3.访问并且下载:
对于获取的数据进行拼接,尤其是对图片的链接进行拼接.然后进行下载!
github 源文件: https://github.com/ivcr/PythonSpider/blob/master/LOL/LOL_Spider
源码:
#!/usr/bin/env python
# -*- coding:utf-8 -*-
#@author:Chris iven
#Python version 3.6
#1.分析LOL官网行为!
#发现这个网页的所有数据都是经过js生成的!意思就是说 他的数据全部不在该网页里面,而是在一个JS文件里面!
#所以我们获取JS文件即可!
import requests
import json,re,os
class LOL_Spider(object):
def __init__(self,url):
self.url &