Python 【爬虫3】_微信小程序_小游戏数据助手数据爬取

2023-05-16

一、背景介绍

近期产生需求,需要批量重复获取微信小程序数据助手的部分数据,减少重复工作,提高效率。

二、环境准备

主要逻辑:charles抓包,分析,爬取,数据存储

环境配置:pc-win10/移动-iphone/软件-charles

* Charles配置与使用,参考的此条链接:https://blog.csdn.net/HeyShHeyou/article/details/90045204

*charles注意事项:

  1. 官网安装包下载可能会很慢,可以去找找其他下载资源
  2. 软件每半小时会断开链接,需要重新启动
  3. 重启后,最好将proxy----windows proxy 去掉勾选(否则会产生过多信息,不容易找到目标链接)
  4. 善于利用清除功能帮助筛选

三、代码实现

  1. 抓包:通过charles抓包,找到所需内容的url
  2. 分析:分析url的content为json格式,根据需求,提取相关数据
  3. 存储:将数据保存到表格中
  4. 查找url规律:分析url规律,进行项目批量循环处理
import requests
import pandas as pd
import pandas as pd
import urllib3


def ltv(url,canshu,content):
    res = requests.get(url, verify=False)
    res = res.json()['data']['sequence_data_list']
    df_LTV = pd.DataFrame(res[canshu]['point_list'])
    df_LTV = df_LTV[['value', 'label']]
    df_LTV.rename(columns={'value': content}, inplace=True)
    return df_LTV


urllib3.disable_warnings()
df = pd.read_csv('WX_account2.csv', sep=',')
df_url = pd.read_csv('url2.csv', sep=',')
df_all2 = pd.DataFrame(columns=['game', 'label'])
for j in range(len(df_url['url'])):
    url = df_url['url'].loc[j]
    content = df_url['content'].loc[j]
    canshu = int(df_url['canshu'].loc[j])
    df_right = pd.DataFrame(columns=[])
    df_all = pd.DataFrame()
    for i in range(len(df['appid'])):
        try:
            game = df['game'].loc[i]
            appid = df['appid'].loc[i].strip()
            url_new = url.format(appid)
            print(i, game)
            df_right = ltv(url_new, canshu, content)
            df_right['game'] = game
            df_all = pd.concat([df_all, df_right], join='outer')
        except:
            continue

    df_all2 = pd.merge(df_all2, df_all, how='right', on=['game', 'label'])

df_all2.to_csv('data.csv', sep=',', index=False, encoding='utf_8_sig')

 

 

 

 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Python 【爬虫3】_微信小程序_小游戏数据助手数据爬取 的相关文章

  • 数据库作业八—嵌套查询、EXISTS、集合查询、基于派生表的查询

    嵌套查询 接着上一篇说 带有EXISTS谓词的查询 EXISTS 存在 带有EXISTS 谓词的子查询不返回任何数据 xff0c 只产生逻辑真值 true 或逻辑假值 false 如果返回true xff0c 主查询会执行 xff0c 返回
  • jupyter安装了tensorflow后一直报错No module named PIL

    以jupyter为例 xff0c 装了anaconda 明明运行pip install Pillow xff0c 显示了已经装载了 xff0c 但是就是找不到PIL包 解决办法就是 xff0c 这个包其实安装在base环境下 xff0c 你
  • makefile中的“立即展开”与“延后展开”

    GUN make的执行过程分为两个阶段 第一阶段 xff1a 读取所有的makefile文件 xff08 包括 MAKEFILES 变量指定的 指示符 include 指定的 以及命令行选项 f xff08 file xff09 指定的ma
  • 接口自动化之持续集成【Jenkins配置--Python+Pytest+Jenkins+Allure】

    前置条件 xff1a 接口自动化测试框架用的是Python 43 Pytest 43 Requests xff1b 本文Jenkins部署在本地电脑 xff08 实际应在服务器 xff0c 当然配置步骤一致 xff09 xff0c 本地部署
  • 【Django】Model query转换成Dataframe时,如何减少50%的内存消耗

    通常我们在Django framework里去取DB数据做处理时 xff0c 会用values 这个function xff0c 然后直接转换成dataframe 假设需要取整个table的数据 xff0c 简单粗暴的写法如下 xff1a
  • 使用pypi-server创建私有pip源

    为了让内网使用pip下载安装 需要在内网中创建pip源 类似离线仓库 使用pypiserver可以指定离线仓库目录 xff0c 将安装包放到离线仓库目录即可 xff0c 只要有人上传一次后 xff0c 其他人需要该模块 xff0c 就不用再
  • UBUNTU下QT开发应用程序常见错误及其解决办法

    错误 xff1a helloworld直接报错 1 error cannot find lGL 原因 xff1a 缺少GL库 解决办法 xff1a sudo apt get install libgl1 mesa dev 我下载 了最新的q
  • 1488:新的开始

    题目描述 发展采矿业当然首先得有矿井 xff0c 小 FF 花了上次探险获得的千分之一的财富请人在岛上挖了 n 口矿井 xff0c 但他似乎忘记考虑的矿井供电问题 为了保证电力的供应 xff0c 小 FF 想到了两种办法 xff1a 在这一
  • 解决:使用 Vue 3 Script Setup 时 ESLint 报错 ‘defineProps‘ is not defined

    解决 xff1a 使用 Vue 3 Script Setup 时 ESLint 报错 defineProps is not defined Vue 3 的 Script Setup 语法引入了 defineProps defineEmits
  • Wek6 A - Tree diameter

    问题描述 xff1a 实验室里原先有一台电脑 编号为1 xff0c 最近氪金带师咕咕东又为实验室购置了N 1台电脑 xff0c 编号为2到N 每台电脑都用网线连接到一台先前安装的电脑上 但是咕咕东担心网速太慢 xff0c 他希望知道第i台电
  • CSCSWek12 B-Happy 消消乐

    题目描述 Q老师是个很老实的老师 xff0c 最近在积极准备考研 Q老师平时只喜欢用Linux系统 xff0c 所以Q老师的电脑上没什么娱乐的游戏 xff0c 所以Q老师平时除了玩Linux上的赛车游戏SuperTuxKart之外 xff0
  • ubuntu中各个文件夹的作用

    Ubuntu的根目录的文件夹各个含义 home xff1a 家目录 xff0c 所有普通用户都有一个以自己名字命名的文件夹存放在这个目录中 普通用户登录ubuntu默认进入的就是家目录中自己的文件夹 xff0c 可用pwd命令查看 xff0
  • 【CUDA】Ubuntu系统如何安装CUDA保姆级教程(2022年最新)

    本期目录 Linux安装CUDA Linux安装CUDA 输入以下命令 xff0c 查看 GPU 支持的最高 CUDA 版本 笔者这里显示的是 11 6 xff0c 这意味着 xff0c 安装的 CUDA 版本必须 lt 61 11 6 n
  • AVI视频格式分析-封装格式

    AVI视频封装格式分析 使用的工具RIFF块CHUNK块LIST块hdrl LISTavih CHUNKstrl LISTstrh CHUNKstrf CHUNK JUNK CHUNKmovi LISTidx1 CHUNK 使用的工具 el
  • 2014.10.10

    1 主要是制作了suse镜像 xff0c 但是还存在很多问题 xff0c 没有加上默认网关 xff0c 我很不开心 xff0c 根目录没有扩展 2 了解了下 boot from image 通过glance上传一个镜像 xff0c 然后通过
  • 2014.10.11

    我只想骂csdn xff01 截图直接粘过来居然不能直接显示出来 xff01 xff01 xff01 妈蛋 xff01 xff01 1 suse镜像制作完善 xff0c 根目录未扩展这是个大问题 xff0c 默认网关没加上 所谓的根目录扩展
  • 2014.10.12

    早晨8点就起了 xff0c 然后匆匆奔向wx xff0c 为了思念的人 xff0c 吃了个中午饭 xff0c 感觉还不错 xff0c 下午回来之后又去了wpj xff0c 胡扯一通 xff0c 而且发现现在家里人的注意力完全放在我的情感生活
  • vmware 下安装 red hat 9,dos 以及wmware tools

    1 安装vmware vmware 版本 7 11 282343 英文原版下载 xff1a http dl sh ctc 2 pchome net 03 lt VMware workstation full 7 1 1 282343 rar
  • 关于上财陈畅的俄罗斯方块的学习

    最近同学学习C xff0c 想做一个大练习 xff0c 于是选择了俄罗斯方块 xff0c 我 xff0c 计算机专业在校学生 xff0c 说实话理论还行 xff0c 实践动手能力很差 xff0c 同学让我先做 xff0c 然后给他讲讲怎样一
  • xrdp开源项目的代码分析

    最近我的博客将重新恢复更新 xff0c 从2012年3月份起 xff0c 我开始参与某公司的堡垒机项目的研发工作 xff0c 堡垒机又叫内控堡垒机 xff0c 运维审计系统 xff0c 相信不少人也听说过 xff0c 目前电信 xff0c

随机推荐