ajax跨域post请求数据_基于Python的Post请求数据爬取

2023-11-20

为什么做这个

  • 和同学聊天,他想爬取一个网站的post请求

观察

  • 该网站的post请求参数有两种类型:(1)参数体放在了query中,即url拼接参数(2)body中要加入一个空的json对象,关于为什么要加入空的json对象,猜测原因为反爬虫。既有query参数又有空对象体的body参数是一件脑洞很大的事情。
  • 一开始先在apizza网站 上了做了相关实验才发现上面这个规律的,并发现该网站的请求参数要为raw形式,要是直接写代码找规律不是一件容易的事情。

源码

import requestsimport jsonheaders = { 'Accept':'application/json, text/javascript, */*; q=0.01', 'X-Requested-With':'XMLHttpRequest', 'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.71 Safari/537.36', 'Content-Type':'application/json', 'Accept-Encoding':'gzip, deflate', 'Accept-Language':'zh-CN,zh;q=0.8', 'Cache-Control':'no-cache', }#空的对象,body参数data = {}data = json.dumps(data)page = 0url = '网站地址,后面为参数?param1=1¶m1='+str(page)response = requests.post(url = url,data=data ,headers =headers )print(response.url)print(response.text)

总结

  • 现在相关工具中发现现象
  • 请求方式确定:post还是get或者其它
  • 参数类型:form-data还是raw或者其它
  • 参数位置:若是post请求,在query中还是body中,还是二者皆有

最后小编个人有六年开发经验,我自己有做python材料的整合,一个完整的python编程学习路线,学习资料和工具。想要这些资料的可以关注小编,并在后台私信:发送“01”领取,希望能帮助到你。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

ajax跨域post请求数据_基于Python的Post请求数据爬取 的相关文章

  • UDP协议与TCP协议的区别

    一 UDP的概述 User Datagram Protocol 用户数据报协议 UDP是传输层的协议 功能即为在IP的数据报服务之上增加了最基本的服务 复用和分用以及差错检测 二 UDP协议与TCP协议的区别 TCP连接时需要三次握手 有时
  • SparkSQL 操作数据库以及代码实践

    作者 禅与计算机程序设计艺术 1 简介 一 关于本文 SparkSQL是Apache Spark项目中用于处理结构化数据的开源模块 它提供了简单易用的API 能够将关系型数据库中的数据转换成DataFrame对象 方便进行各种分析查询 在实
  • 忘记阿里云远程连接密码怎么办

    此密码是连接终端控制台的密码 1 随便输入一个密码 点击确定 2 密码错误后网页右侧顶端出现1个修改远程连接密码的按钮 点击进去修改密码就OK了 QQ交流群 162136059
  • 二十四种设计模式之策略模式

    一 什么是策略模式 简单来说 策略模式是将每一个算法封装到拥有共同接口的不同类中 使得算法可以在不影响客户端的情况下发生变化 也可以理解为可供程序运行时选择的 不同的类 不同的解决方案 策略模式的特点 高内聚低耦合 可扩展 遵循ocp原则
  • rabbitmq 一般启动或服务启动

    rabbitmq managemen是管理后台的插件 我们要开启这个插件才能通过浏览器访问登录页面 进入到sbin目录下 rabbitmq plugins enable rabbitmq management 一般启动 服务启动 执行 ra
  • 计算机图形学---常用颜色模型汇总(RGB,CMY,HSV)

    本文整理自西安交通大学软件学院祝继华老师的计算机图形学课件 请勿转载 文章目录 常用颜色模型 RGB颜色模型 CMY颜色模型 HSV颜色模型 常用颜色模型 颜色模型 某个三维颜色空间中的一个可见光子集 包含某个颜色域的所有颜色 用途 在某个
  • 抓取微信文章:使用代理来处理反爬虫措施

    参考 崔庆才老师教程 目标网站分析 我们将从搜狗 微信这个网址来爬取微信的文章 https weixin sogou com 输入 程序员 并搜索 可以看到上方的URL有许多的信息 我们只保留query type page这几个参数即可 修
  • 多媒体开发计算机颜色相关知识

    颜色模式 颜色模式 颜色模型和颜色空间 计算机中的颜色格式 常用的颜色模型分类 RGB颜色模型 介绍 RGB模型的颜色空间 RGB555 RGB565 RGB24 RGB32 FFMPEG中定义的RGB色彩空间 显示器的颜色空间
  • nestjs:typeorm out of range value for column

    参考 nestjs How to store big int in nest js using typeorm Stack Overflow Column type bigint
  • 使用tensorflow时cuda报错Could not load dynamic library ‘libcudart.so.11.0‘; dlerror: libcudart.so.11.0:

    dlerror libcudart so 11 0 问题解决 首先找到你的电脑路径 usr local cuda lib64 查看自己的cuda版本 根据上图发现我的电脑的cuda版本为10 0 因此运行时会报错 这时有两种解决方案 方案一
  • 定时器详解

    1 什么是定时器 timer 定时器实际上就是Soc当中的一个内部外设 1 定时器与计数器 定时器常与计数器扯到一起 计数器也是soc当中的一个内部外设 计数器顾名思义是用来计数的 就和我们的秒表一样 秒表实际上就是一个计数器 每隔一个单位
  • #pragma once的作用以及全局变量的问题

    提出问题 第一次遇到 pragma once的时候 到网上找了些资料 大部分答案都大同小异 大概意思是让编译器只编译一次 我们都知道 一般不在头文件中定义全局变量 因为那会导致该变量多次定义 那么问题来了 既然用 pragma once预编
  • DevOps极速入门丨Gitlab丨Jenkins丨harbor丨CICD丨自动化丨运维开发

    DevOps极速入门丨Gitlab丨Jenkins丨harbor丨CICD丨自动化丨运维开发 一 DevOps介绍 软件开发最开始是由两个团队组成 开发计划由开发团队从头开始设计和整体系统的构建 需要系统不停的迭代更新 运维团队将开发团队的
  • MySQL索引详细版

    一 MySQL索引是什么 MySQL索引是一种用于快速查找特定数据的数据结构 在MySQL中 索引通常是在表的某些列上创建 这些列可以是主键 唯一键或普通索引 使用索引可以极大地提高数据库查询的性能 减少数据访问时间 通过使用索引 可以避免
  • 成员函数之析构函数

    定义 析构函数 与构造函数功能相反 析构函数不是完成对象的销毁 局部对象销毁工作是由编译器完成的 而对象在销毁时会自动调用析构函数 完成类的一些资源清理工作 特征 1 析构函数名是在类名前加上字符 2 无参数无返回值 3 一个类有且只有一个
  • Flutter入门到精通:学习路线与思路

    Flutter入门到精通 学习路线与思路 Flutter是一种跨平台的移动应用开发框架 由Google开发和维护 它可以让开发者使用一套代码构建高性能 美观且流畅的移动应用程序 无论是从入门到精通 还是从零基础到掌握 都需要有一个系统而有序
  • html页面撑满整屏幕,让div撑满整个屏幕的方法(css)

    这篇文章主要介绍了关于让div撑满整个屏幕的方法 css 有着一定的参考价值 现在分享给大家 有需要的朋友可以参考一下 在body只有一个p的时候 可以通过这样的方式让p撑满整个屏幕 1 给p设置定位 复习一下 css中position有五
  • MLIR再深入 —— CodeGen 总结

    文章目录 前言 现状 Classification Dialects of Interest 一些现存的 pipelines TensorFlow Kernel Generator IREE Compiler LLVM Target IRE
  • 【Unity步步升】监控与检测物体的各种方案,如:射线、碰撞、挂载等...

    在制作AR模型数值控制方案的时候遇到了检测的问题 学习过程受益匪浅 故今天为大家整理带来一篇监控与检测物体的参考方案集合 目录 一 射线检测 二 物体存在检测 三 碰撞检测 一 射线检测 单射线检测 首先完成搭建场景如下图1 1 我这里用到

随机推荐

  • 微波技术与天线_HFSS_仿真实现威尔金森(Wilkinson)功分器

    1 仿真要求 设计并建模仿真微带Wilkinson功分器 对参数L70 2进行参数优化 使其满足以下性能指标 微带Wilkinson功分器性能指标 结构概览 2 步骤 1 绘制介质基板 介质基板厚度为1 6mm 长度为60mm 宽度待定 与
  • 什么才是真正的架构设计?(一)

    一 什么是架构和架构本质 在软件行业 对于什么是架构 都有很多的争论 每个人都有自己的理解 此君说的架构和彼君理解的架构未必是一回事 因此我们在讨论架构之前 我们先讨论架构的概念定义 概念是人认识这个世界的基础 并用来沟通的手段 如果对架构
  • 7-13 图的存储 (15 分)

    7 13 图的存储 15 分 输出给定图的邻接矩阵和邻接表 输入格式 输入第一行给出三个正整数 分别表示无向图的节点数N 1
  • 华为一直响应服务器异常,服务器异常是咋回事

    服务器异常是咋回事 内容精选 换一换 虚拟私有云为弹性云服务器构建隔离的 用户自主配置和管理的虚拟网络环境 提升用户云中资源的安全性 简化用户的网络部署 当您的弹性云服务器要访问Internet时 您可使用虚拟私有云创建的弹性公网IP绑定到
  • EasyPoi导入导出(一)

    EasyPoi是一个文件导入导出的工具插件 官网 http doc wupaas com docs easypoi easypoi 1c0u4mo8p4ro8 一 EasyPoi简单应用 导出excel 1 1 创建一个普通的maven项目
  • 快速部署Ceph分布式高可用集群

    快速部署Ceph分布式高可用集群 Ceph简介 Ceph是一个PB EB级别的分布式存储系统 可以提供文件存储 对象存储 和块存储 它可靠性高 易扩展 管理简便 其中对象存储和块存储可以和其他云平台集成 一个Ceph集群中有Monitor节
  • 面试题:如何测试微信朋友圈(附图)

    如果碰到这种题目 我们可以从以下几个方面来分析 功能 界面 易用性 中断 网络 兼容性 安全性 性能测试 功能测试 1 朋友圈发送功能 1 只发送文本 a 考虑文本长度 1 1500字符 该数据为百度数据 超出最大字符长度 b 考虑文本类型
  • 用Python让奇怪的想法变成现实,2023年继续创作

    2023年继续写作 用文章记录生活 时间过得真快 一下就到2023年了 由于疫情肆虐 在网络的游弋的实现也长了 写作的自然也多了 回想一下 2018 2021年这三年时间里一篇文章也没写过为0 哈哈 没错 为0 这段时间总是忙于自己的工作
  • eclipse导入mysql jdbc驱动包的具体步骤及注意事项

    1 导入的驱动包的版本和mysql的版本是对应关系的 具体关系如下 Connector J 5 1 支持Mysql 4 1 Mysql 5 0 Mysql 5 1 Mysql 6 0 alpha这些版本 Connector J 5 0 支持
  • python使用rjust把二进制数变换成指定位宽

    首先使用bin把数转换成二进制数 然后使用rjust把该数转换为指定位宽 并且可以指定以什么数对齐 使用示例 b rjust w s 其中b是一个二进制数 w是指定位宽 s是补的数 b reverse 可以把b倒序
  • notepad++突然崩溃,保存的文件没了怎么办

    notepad还是很牛逼的 备份文件 C Users 你当前用户的用户名 AppData Roaming Notepad backup可以恢复
  • codeforces 102263 J

    题目 一开始贪心 直接枚举每个位置 一直wa 不知道错哪里了 后来才发现是dp 很多种情况是无法直接贪心的 设 d p i 0
  • 手把手教你用Python轻松玩转SQL注入——渗透利器

    前言 大家好 我是黄伟 相信大家经常有听到过SQL注入啥的 但是并不是特别了解 小编以前就是经常听别人说 但是自己啥都不懂 直到后来看了相关教材后才明白 原来是这么个东西 那么到底是什么东西了 又或者是不是个东西了 我们接着往下看 一 浅谈
  • Flutter 宽高自适应

    在Flutter开发中也需要宽高自适应 手动写一个工具类 集成之后在像素后面直接使用 px或者 rpx即可 工具类代码如下 import dart ui class HYSizeFit static double screenWidth 0
  • GitHub Action入门简介

    1 What is GitHub Actions GItHub Actions是一个持续集成和持续交付的平台 能够让你自动化你的编译 测试和部署流程 GitHub 提供 Linux Windows 和 macOS 虚拟机来运行您的工作流程
  • 《计算机系统2》学习笔记

    目录 计算机系统漫游 Amdahl定理 信息的表示和处理 信息存储 进制转化 小端法 大端法 布尔代数 位级运算 逻辑运算 移位运算 整数表示 无符号数编码 补码编码 有符号数和无符号数之间的转换 扩展数的位表示 截断数字 整数运算 无符号
  • 将Enum枚举转成Map,List结构

    JAVA枚举功能强大 感觉就像是一种简化版的类对象 可以有构造方法 可以重载 可以继承接口等等 JAVA枚举在实际开发中应用相当频繁 以下几个封装方法在实际开发中可能用到 将枚举类转化为Map以及List结构的一些操作方法 首先 新建一个枚
  • qt file not found 原因之一

    14 error h file not found 原因之一 在pri中说明的cpp文件 如果其中 include 本pri定义的其它文件 则会直接以此cpp文件为基础进行寻找 在 include 文件时 可以在cpp文件所在目录下 或以此
  • Qt中父子widget的事件传递

    以前我一直以为 在父widget上摆一个子widget后 当click子widget时 只会进入到子widget的相关事件处理函数中 比如进入到mousePressEvent 中 而不会进入到父widget的对应事件处理函数中 毕竟 cli
  • ajax跨域post请求数据_基于Python的Post请求数据爬取

    为什么做这个 和同学聊天 他想爬取一个网站的post请求 观察 该网站的post请求参数有两种类型 1 参数体放在了query中 即url拼接参数 2 body中要加入一个空的json对象 关于为什么要加入空的json对象 猜测原因为反爬虫