json解析豆瓣数据

2023-11-17

继续上次的文章，我们找到了json的数据包，那么证明我们可以获取到他们的数据。

点击Headers,Request URL对应的就是json数据的url。

找到url之后我们就可以开始爬虫了。

import requests
import json
import jsonpath

if __name__ == '__main__':
    #json数据的url(链接)
    url_ = 'https://movie.douban.com/j/search_subjects?type=tv&tag=%E7%83%AD%E9%97%A8&page_limit=50&page_start=0'
    #请求头参数，有一些网站比较严格，所以要携带上
    headers_ = {
        #Cookie 每个手机，电脑请求的到的都不一样，也可以使用我这个
        'Cookie':'ll="118288"; bid=WNmW8xeE1WU; _vwo_uuid_v2=D518432420B0EFE08F30999B3E1F63F8A|3647f77f1dd3acd1718a37891ea18bce; _ga=GA1.2.1331951364.1626512396; gr_user_id=eebfffd2-255f-4ee9-9520-55358f3a07a3; __yadk_uid=WtfdGVdYe4Pqxe79Jj9YlozCai1av1xW; ct=y; dbcl2="244686947:nV4+FwTXi9o"; push_doumail_num=0; push_noty_num=0; __utmv=30149280.24468; __gads=ID=542d39b73c948918-2220fbcc0fcb0001:T=1626512409:RT=1629436017:S=ALNI_MaE_YW5Tpnl7s-9BTDiCmS4Jvb0xA; douban-fav-remind=1; ck=RR8z; _pk_ref.100001.4cf6=%5B%22%22%2C%22%22%2C1631605636%2C%22https%3A%2F%2Fwww.baidu.com%2Flink%3Furl%3DK3049iyI9I-pP5SJ_IYWHAb80TU6ErcNeJVnX1v0tD_wBa1pKgPC_MOuXS67bX82%26wd%3D%26eqid%3Dd041a3df00020d6b0000000661405380%22%5D; _pk_ses.100001.4cf6=*; ap_v=0,6.0; __utma=30149280.1331951364.1626512396.1631591847.1631605636.25; __utmb=30149280.0.10.1631605636; __utmc=30149280; __utmz=30149280.1631605636.25.21.utmcsr=baidu|utmccn=(organic)|utmcmd=organic; __utma=223695111.411956023.1626512401.1631591847.1631605636.24; __utmb=223695111.0.10.1631605636; __utmc=223695111; __utmz=223695111.1631605636.24.20.utmcsr=baidu|utmccn=(organic)|utmcmd=organic; _pk_id.100001.4cf6=32db886b983a2094.1626512401.23.1631605642.1631592297.',
        #Referer 意思就是说，是从豆瓣这个链接过来的，管他是不是，反正是欺骗服务器的
        'Referer':'https://movie.douban.com/',
        #这个User_Agent呢，是你电脑的型号，什么系统，多少位的电脑什么的，也是独一无二的
        'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/93.0.4577.63 Safari/537.36'
    }
    #发送请求
    response_ = requests.get(url_,headers = headers_)
    #获取到的数据直接转json数据
    data_ = response_.json()
    # print(data_)
    #获取电影名字
    title_name =  jsonpath.jsonpath(data_,'$..title')
    #获取评分
    rate_ = jsonpath.jsonpath(data_,'$..rate')
    #获取电影的链接
    url_data = jsonpath.jsonpath(data_,'$..url')
    # print(title_name)
    # print(rate_)
    # print(url_data)

    #将解析出来的数据保存到本地
    with open('douban.txt','w',encoding='utf-8')as f:
        for i in range(len(title_name)):
            dict_ = {}
            dict_[title_name[i]] = rate_[i]
            # print(dict_)
            dict_[i] = url_data[i]
            print(dict_)
            json_data = json.dumps(dict_, ensure_ascii=False) + ',\n'
            f.write(json_data)

下一篇放jspnpath解析json数据。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

json

html

html5

json解析豆瓣数据的相关文章

json文件格式的升级路径

我们将 Java 应用程序的用户首选项存储在 JSON 文件中使用Jackson http jackson codehaus org 随着我们继续开发该应用程序我们将添加首选项重命名首选项并删除过时的首选项当用户将应用程序升级到下一
可以通过 url 发送 JSON 吗？

我有一个 ruby 哈希其中键是 url 值是整数我将哈希值转换为 JSON 我想知道是否能够通过 AJAX 请求在 url 内发送 JSON 然后从 params 哈希值中提取该 JSON 另外我将把 JSON 化的 ruby 哈希
Ajax调用完成后执行函数

我是 Ajax 新手我尝试在使用 for 循环时使用 Ajax Ajax 调用之后我正在运行一个使用 Ajax 调用中创建的变量的函数该函数只执行两次我认为 Ajax 调用可能没有足够的时间在循环开始之前进行调用有没有办法在运行
如何清除画布中图像上的矩形

我需要清除画布中图像上绘制的矩形而不损坏现有图像我可以绘制小矩形点并将其清除但问题是当我清除矩形时它在图像上仍保留为白色小斑点有人可以告诉我如何清除图像上的矩形而不损坏现有图像我使用了以下方法来清除矩形但没有用 1 cont
data:image/png;base64 是什么意思？

我从一个在线网站上举了一个例子 CSS 包含一个指向 png 的 URL 和一些随机字母在这两种情况下任何人都可以告诉我如何制作这样的代码或者更确切地说这些代码是关于什么的这是html
如何在 json 中输出 javascript 日期

我正在尝试时间线图表 http code google com apis visualization documentation gallery annotatedtimeline html Data Format http code go
Rails：使用水豚填充动态字段

我有一个通过 javascript 动态创建的带有长 id 的文本字段 user user skills attributes 69878013874980 skill title 哪里的69878013874980是生成的时间戳如何在水
聚合物在核心输入上使用功能验证

有人可以解释一下如何使用函数验证吗这种聚合物元素 http www polymer project org docs elements core elements html core input 导航到验证部分
如何通过html5视频标签检查浏览器是否可以播放mp4？

如何通过html5视频标签检查浏览器是否可以播放mp4 这可能对您有帮助
Laravel 5.4 将json保存到数据库

帮我将 json 保存到数据库表字段类型文本我有带有强制转换数组的模型 class Salesteam extends Model protected casts team members gt array 我想要像这样 index
Flexbox 调整大小和可滚动溢出[重复]

这个问题在这里已经有答案了我有正在调整大小的内容并且我想要一个固定标题该标题不会增大缩小并且不属于可滚动内容的一部分如果空间不足下面的内容将变得可滚动内容外包装 flexGrowWrapper has a flex grow
将值设置为输入字段时，西班牙语文本无法正确显示

我正在尝试将西班牙语文本设置到输入字段但它似乎没有正确显示但是如果相同的文本位于 div 内部或已设置为输入字段的值则该文本可以正常显示 HTML div Cuenta de Ahorros Persona F iacute sic
jquery无法获取data属性值

我正在尝试在 jQuery 中设置一个变量该值应该在按钮的单击事件上设置 onclick 事件触发但 x10Device 变量仍然存在undefined 我使用的是jquery 1 7 1 jQuery x10Device this d
如何在Python中将提取的文本从PDF转换为JSON或XML格式？

我正在使用 PyPDF2 从 PDF 文件中提取数据然后转换为文本格式该文件的 PDF 格式如下 Name John Address 123street USA Phone No 123456 Gender Male Name Jim
JSF 不呈现自定义 HTML 标记属性

我想向我的登录表单添加一些 iOS 特定的标签属性如果我查看我的网页源代码就会发现自动更正自动大写和拼写检查属性不存在这是什么原因呢我正在使用 JSF 2 x
使用 IE9、10、11 的 CSS 将比例打印到 50% 等百分比

Zoom css 属性不适用于 IE9 10 11 观察到打印预览 UI 令人不安默认比例为缩小以适合当我将此比例从缩小更改为适合 50 时页面显示正常打印预览任何人都可以帮助我如何使用 CSS 代码将比例设置为 50 为页
如何将本地文本文件上传到文本区域（网页内）

我是一名新手程序员需要一些帮助来弄清楚如何将本地文本文件上传到我正在构建的网站内的文本区域我非常精通 HTML CSS 对 Javascript JQuery 有相当的了解而且我刚刚学习 PHP 您能提供的任何帮助我将不胜感激我有一
未捕获的异常：数据表编辑器 - 不允许远程托管代码

我正在尝试使用 Datatables 使用 datatableseditor 来实现 CRUD 操作但是我收到错误消息 1 未捕获的异常数据表编辑器不允许远程托管代码请参见http editor datatables net有关如何
在“onClick”上切换 DIV 高度

我想切换分区的高度我尝试过将 animate 与 if else 语句一起使用但它只会反弹我现在使用的代码将隐藏我的分区而不是切换高度点击时会触发 document ready function content1 toggle fu
使用
和元素作为 JavaScript 代码的输入。这是最好的方法吗？

各位显然我是编码新手所以最近完成了一些有关 HTML 和 Javascript 的 Lynda 课程后我的简单 HTML 页面遇到了困难基本上我想要的是使用 JavaScript 进行基本计算让用户使用 HTML 输入两个数字

随机推荐

别踩雷了!交互设计必须遵守这10大规范！

UI 设计师需要理解交互设计因为不懂交互的 UI 设计师不能成为优秀的 UI 设计师交互设计涉及用户与产品及其使用的服务之间的关系而 UI 设计不仅仅是将功能需求可视化还需要创造卓越的用户体验因此大多数 UI 设计师需要了解交互
第二十一节：JS中的继承

上节回顾 1 所有函数都有一个特殊属性 prototype prototype指向一个对象称之为原型对象原型对象上只有一个属性 constructor constructor又指向了构造函数形成了一个闭环 2 所有对象都有一个
C++学习（四六九）LRU Least Recently Used算法

LRU是Least Recently Used的缩写即最近最少使用最近一段时间最少使用是一种常用的页面置换算法选择最近最久未使用的页面予以淘汰该算法赋予每个页面一个访问字段用来记录一个页面自上次被访问以来所经历的时间 t 当须淘
python解释器多版本安装

文章目录 1 python解释器的安装 2 配置环境变量 3 在cmd窗口使用python多版本 1 python解释器的安装要想让计算机能够识别并运行高级语言要对应类型的翻译官 python这种编程语言的翻译官就是python解释器
网页设计手绘板绘画板，适合初学者学习使用，HTML

作品如下动态图下载链接在文末点我免费下载资源资源下载链接 https download csdn net download weixin 43474701 34854658
Linux系统管理

磁盘管理磁盘基本概述 Linux中磁盘的命名方式与磁盘的接口有关规则如下传统IDE接口硬盘 dev hd a z SCISI接口硬盘 dev sd a z 虚拟化硬盘 dev vd a z 在设备名称的定义规则如下其他分区可以以此类
MongoDB安装(win)Redis安装

下载MongoDB 全MonogoDB链接 win安装进入e盘找到安装好的文件路径以E 盘为例在bin目录同级下创建一个文件夹 data 在data里面创建一个db和logs文件夹进入logs创建一个文本文档 monogo log
为分布式做准备吧——深入理解JVM

文章目录类加载机制类执行机制字节码解释执行运行时编译执行反射执行内存回收内存空间收集器 Sun JDK可用的GC 之前我们文章提到过反射说的比较浅显我们这里来理解JVM 一个标准的JVM是这样的 JVM负责装载cla
关于剪映电脑版无法打开的问题！

剪映专业版安装到电脑上使用几次后突然就打不开了经过几天的漫长查找网上也无一个答案说什么字体冲突的都不是病根这个bug病根是业务层加载不到veCreator dll 代码里尝试去加载veCreator dll dll 导致异常下
使用OSWatcher来监控服务器

OSWatcher是oracle提供的监控服务器资源的工具配合AWR等工具为调优数据库提供基本信息 OSWatcher有支持不同平台 WINDOWS平台下 OSWatcher For Windows OSWFW LINUX平台 OS Wa
RGMII信号是什么样子的----大揭秘

RGMII信号测试 1 测试RGMII 先判断RGMII信号频率多少就知道是千兆百兆的模式发送时钟信号速率为Gbit s时时钟速率为125MHz 速率为100Mbit s时速率为25MHz 速率为10Mbit s时速率为2 5
java自动化测试语言基础之方法

java自动化测试语言基础之方法文章目录 java自动化测试语言基础之方法 Java 方法 Java 方法在前面几个章节中我们经常使用到 System out println 那么它是什么呢 println 是一个方法 System 是
Linux网络通信----htonl()、htons()、ntohl()、ntohs()四个函数

转载 https blog csdn net miao19920101 article details 69398158 前言今天在工作中用到htonl 这个函数不是很理解查阅资料之后随笔就记录下来方便以后工作和学习翻阅首先需要说
python反复运行清空plot图_仅清除matplotlib图的一部分

我正在使用嵌入在Wx Python GUI中的matplotlib图来呈现一些数据图中的内容显示的数据随点击按钮的功能不断变化数据有两种类型 1 轮廓线 self axes contour x scale map y scale m
并发锁的学习

锁锁的定义锁是用来协调多个线程并发访问同一共享资源时带来的安全问题频繁用锁必然会带来性能问题但不用锁又会造成安全问题 1 从性能上分乐观锁和悲观锁乐观锁 CAS自旋锁是非常经典的乐观锁并发性能比较好但是自旋会造成很大的开销
Python经典练习题——求水仙花数

严格来说我并不知道何谓水仙花数因为以前读书时根本没听过这种数也不知道这种数有什么特征后来从事编程之后反而听说了所谓的水仙花数如果通过网络查询则发现水仙花数的定义也不统一比如通过baidu百科查到如下定义水仙花数 Narc
元数据管理工具atlas初探

元数据管理工具atlas初探安装 Ambari添加服务略 Hive配置将atlas主节点 usr hdp 2 6 3 0 235 atlas hook拷贝到其他节点自定义hive env HIVE AUX JARS PATH usr
携手区块链技术，踏上可信“双碳”之路

自中央明确提出碳达峰碳中和的双碳目标以来区块链技术凭借能为碳排放碳足迹打上可信标签的天赋异禀引起了政策部门学术界及产业实践代表们的高度重视 7月11日在第33个全国节能宣传周之际全国低碳日前夕微众区块链联合金链盟 FISC
gcc生成静态库与动态库（附带使用方法）

目录前言 1 gcc生成静态库从使用者的角度出发如何使用别人的静态库方法1 方法2 直接使用静态库 2 gcc生成动态库动态库的使用第二种方法与使用静态库的方法一样解决方案方法3 ldconfig 配置 etc ld so
json解析豆瓣数据

继续上次的文章我们找到了json的数据包那么证明我们可以获取到他们的数据点击Headers Request URL对应的就是json数据的url 找到url之后我们就可以开始爬虫了 import requests import jso

json解析豆瓣数据

json解析豆瓣数据 的相关文章

随机推荐

热门标签

json解析豆瓣数据的相关文章