python如何快速采集美~女视频?无反爬

2023-11-17

人生苦短 我用python~

这次康康能给大家整点好看的不~

在这里插入图片描述

环境使用:

  • Python 3.8

  • Pycharm

  • mou歌浏览器
    mou歌驱动 —> 驱动版本要和浏览器版本最相近 <大版本一样, 小版本最相近>

模块使用:

  • requests >>> pip install requests

  • selenium >>> pip install selenium==3.141.0 <需要浏览器和浏览器驱动>
    默认安装 4.0版本 语法上面有点区别

  • re

  • json

卸载模块: pip uninstall selenium 卸载模块

安装python第三方模块:

  1. win + R 输入 cmd 点击确定, 输入安装命令 pip install 模块名 (pip install requests) 回车

  2. 在pycharm中点击Terminal(终端) 输入安装命令

在这里插入图片描述

基本思路流程: <通用>

一. 数据来源分析:

  1. 明确需求:

    采集什么数据内容

    I. 视频播放链接

    II. 视频标题

  2. 通过浏览器自带工具: 开发者工具, 进行抓包分析

    打开开发者工具: F12 / 鼠标右键点击检查选择network

    刷新网页: 让本网页数据内容重新加载一遍

    分析/找到 视频播放链接在哪里

    1. 选择 media <媒体文件> 可以直接看到 视频播放链接

    2. 通过搜索分析可以直接找到 视频播放链接/ 视频标题

二. 代码实现步骤:

  1. 发送请求, 模拟浏览器对于url地址发送请求

  2. 获取数据, 获取服务器返回响应数据

    开发者工具: response <网页源代码>

  3. 解析数据, 提取我们想要的数据内容

    视频标题

    视频播放链接

  4. 保存数据, 把视频内容保存本地文件夹


代码展示

导入模块

导入数据请求模块
import requests
import re
import json
from pprint import pprint
from selenium import webdriver
import time

创建浏览器对象,
实例化对象
自动打开浏览器

driver = webdriver.Chrome()
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

python如何快速采集美~女视频?无反爬 的相关文章

随机推荐

  • 页面切换后,滚动栏问题

    项目场景 提示 react项目antd后台管理系统 问题描述 后台管理系统从a页面进入b页面 a页面有数据 有滚动条 且scollTop大于0 进入b页面后 滚动条不是位于初始位置 scollTop不等于0 b页面不是位于页面顶部 a页面
  • mysql 存储长文本

    在写项目时 需要把文章中的图文存储到mysql中数据库中 查了一下 gt 可以使用TEXT BLOB俩种类型来存储长文本 1 TEXT TEXT有4有类型 TINYTEXT 256bytes TEXT 64kb MEDIUMTEXT 16M
  • Spring常见面试题

    说说你对IOC的理解 相当于自己找女朋友和婚介公司帮忙找女朋友的过程 IOC可以重点理解以下几个部分 1 谁控制谁 在之前的编程过程中 都是需要什么对象就自己去创建什么对象 由程序员来控制对象 而有了IOC容器之后 就变成由IOC容器来控制
  • VS-Qt环境下dll

    首先 不得不承认的是 Qt中的数据类型使用很方便 当我们的主框架是基于Qt的时候也就没必要刻意追求辅助函数所在的dll是Win32的 如果原功能函数就是只使用标准库及基础类型 那也可以在Qt框架中调用 这不是本篇的重点 我们之所以要使用Qt
  • GetOpenFilename的基本用法

    GetOpenFilename 一 概述基本语法 Application GetOpenFilename 方法 显示标准的 打开 对话框 并获取用户文件名 而不必真正打开任何文件 只是把打开文件名称返回程序 GetOpenFilename相
  • httpClient 几种超时问题

    HttpClient的有3种超时时间 分别是 1 java view plaincopyprint ConnManagerParams setTimeout params 1000 ConnManagerParams setTimeout
  • [论文阅读] (21)S&P21 Survivalism: Systematic Analysis of Windows Malware Living-Off-The-Land (经典离地攻击)

    娜璋带你读论文 系列主要是督促自己阅读优秀论文及听取学术讲座 并分享给大家 希望您喜欢 由于作者的英文水平和学术能力不高 需要不断提升 所以还请大家批评指正 非常欢迎大家给我留言评论 学术路上期待与您前行 加油 前一篇从个人角度介绍USEN
  • python字典取值的几种方法

    Python 字典 dictionary 是一种可变容器模型 可以存储任意数量的任意类型的数据 字典中的每个元素由一个键和一个值组成 键和值之间用冒号分隔 字典通常用于存储键值对的数据 例如在数据库中存储记录 以下是 Python 字典取值
  • Unity将屏幕坐标转为世界坐标的思路

    1 使用ScreenToWorldPoint将获取的屏幕位置直接转成世界坐标 坑1 获取的屏幕坐标Input mousePosition是一个2d坐标 z轴值为0 这个z值是相对于当前camera的 为零表示z轴与相机重合了 因此给Scre
  • Floyd算法

    Floyd算法又称为插点法 是一种利用动态规划的思想寻找给定的加权图中多源点之间最短路径的算法 与Dijkstra算法类似 该算法名称以创始人之一 1978年图灵奖获得者 斯坦福大学计算机科学系教授罗伯特 弗洛伊德命名 Dijkstra算法
  • Unsatisfied dependency expressed through field ‘userMapper‘问题解决

    SSM框架练手 mapper层 Autowire创建bean怎么也不成功 报错 org springframework beans factory UnsatisfiedDependencyException Error creating
  • JS 两个对象数组根据id去重 / 取补集

    let arr1 id 1 name a id 2 name b id 3 name c let arr2 id 1 name a let newArr arr1 filter item gt arr2 some val gt item1
  • 硬盘运行与“AHCI 模式”还是“IDE 模式” 分类: 生活百科 ...

    如今SATA硬盘越来越流行 最新购买或者组装的电脑 基本都安装新一代的SATA硬盘 由于绝大多数BIOS初始设置是 IDE模式 安装的windows XP和vista系统 并没有运行发挥最大性能的 AHCI模式 到底自己的系统是否运行与 A
  • SQL语句详解(四)——SQL联表查询

    今天我们继续给大家介绍MySQL相关知识 本文主要内容是SQL联表查询 一 SQL联表查询简介 在前文SQL语句详解 三 SQL子查询中 我们给大家介绍了SQL子查询的相关知识和使用示例 实际上 如果涉及到SQL多个表之间的查询 使用SQL
  • Java面向对象——图书管理系统(小白也能看的懂!)

    文章目录 一 功能介绍 二 JAVA面向对象思想 包的分装 1 book包 2 user包 较复杂 3 operation包 接口包 三 代码框架的搭建 1 book包 Book类 2 book包 BookList类 3 operation
  • 手机如何远程控制挂机宝? 影云挂机宝

    首先我们需要知道挂机宝是什么 挂机宝就相当于云电脑 24小时在线挂机 1 手机远程的话我们需要用到一个软件 微软远程桌面 远程桌面软件很多 这个随意 喜欢用哪个都行 安卓下载 https www lanzous com i2i8bti 密码
  • android Jar文件的数字签名

    转自 http hubingforever blog 163 com blog static 17104057920118104058241 JAR文件可以用 jarsigner工具或者直接通过 java securityAPI 签名 签名
  • 利用ChatGPT提高代码质量的5种方法

    本文首发于公众号 更AI power ai 欢迎关注 编程 AI干货及时送 5个可以提升你日常工作效率的ChatGPT特性 如何利用它提高代码质量 ChatGPT已经彻底改变了开发代码的方式 然而 大多数软件开发人员和数据专业人员仍然没有使
  • 坐标移动Python

    A 向左移动 D 向右移动 W 向上移动 S 向下移动 从 0 0 点开始移动 输入 合法坐标为A 或者D或者W或者S 数字 两位以内 非法坐标点需要进行丢弃 如AA10 A1A YAD 等 flag input split for ite
  • python如何快速采集美~女视频?无反爬

    人生苦短 我用python 这次康康能给大家整点好看的不 环境使用 Python 3 8 Pycharm mou歌浏览器 mou歌驱动 gt 驱动版本要和浏览器版本最相近 lt 大版本一样 小版本最相近 gt 模块使用 requests g