爬虫小项目

2023-11-15

#爬取同花顺官网中的数据  共四页  项目适合练手  最终保存在csv文件中

#尚有缺点  先发出来  一起探讨  qq:2385455226  欢迎来访

import requests
from lxml import html
headers = {
'Accept': 'text/html, */*; q=0.01',
'Accept-Encoding': 'gzip, deflate',
'Accept-Language': 'zh-CN,zh;q=0.9',
'Cache-Control': 'no-cache',
'Connection': 'keep-alive',
'Cookie': '__utma=156575163.1547851450.1557741097.1557741097.1558270926.2; __utmz=156575163.1558270926.2.2.utmcsr=10jqka.com.cn|utmccn=(referral)|utmcmd=referral|utmcct=/; refreshStat=off; log=; Hm_lvt_78c58f01938e4d85eaf619eae71b4ed1=1557739152,1558270937,1558341509,1558417235; Hm_lvt_60bad21af9c824a4a0530d5dbf4357ca=1557749473,1558271070,1558341991,1558417357; Hm_lvt_f79b64788a4e377c608617fba4c736e2=1557749474,1558271070,1558341991,1558417357; Hm_lpvt_60bad21af9c824a4a0530d5dbf4357ca=1558417391; Hm_lpvt_78c58f01938e4d85eaf619eae71b4ed1=1558417391; Hm_lpvt_f79b64788a4e377c608617fba4c736e2=1558417391; v=Agqx8HNlYqY8be4KVLfuTfT9W_uv-49tgH0C-ZRDtNrptaStfIveZVAPUgpn',
'hexin-v': 'Agqx8HNlYqY8be4KVLfuTfT9W_uv-49tgH0C-ZRDtNrptaStfIveZVAPUgpn',
'Host': 'data.10jqka.com.cn',
'Pragma': 'no-cache',
'Referer': 'http://data.10jqka.com.cn/market/rzrq/board/sh/',
#有问题,自行换一个
'User-Agent': 'Mozilla/5.0 (Windows NT 6.2) AppleWebKit/535.11 (KHTML, like Gecko) ',

}
for i in range(1,5):
    url = 'http://data.10jqka.com.cn/market/rzrq/board/getRzrqPage/page/%d/ajax/1/'%i
    res = requests.get(url=url,headers=headers)
    etree = html.etree
    cont = etree.HTML(res.text)
    s1 = cont.xpath("//thead/tr[1]/th/text()")
    print(s1)
    s2 = cont.xpath("//thead/tr[2]/th/text()")
    s2.insert(0, '交易日期')
    f = open('tonghua3.csv', 'a', encoding='gbk')
    t1 = str(s2).replace('[', '').replace(']', '').replace("'", '') + '\n'
    print(t1)
    # for t2 in t1:
    f.write(t1)
    s3 = cont.xpath("//tbody/tr/td/text()")
    # print(s3)
    # print(len(s3))
    s4 = []
    # 使用切片的方式将大列表分为小列表
    for i in range(0, len(s3), 13):
        s4.append(s3[i:i + 13])
        # print(s4)
    for item in s4:
        # print(item)
        s = str(item).replace('[', '').replace(']', '').replace("'", '') + '\n'
        print(s)
        # for s in item:
        #     print(s)
        #
        f.write(s)
f.close()
    # f.write(str(item))
    # f.close()
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

爬虫小项目 的相关文章

  • LeGO-LOAM代码详细注释版

    学习LeGO LOAM时 写的代码注释github代码链接 一部分注释来自github用户wykxwyc 一部分来自网上查阅 还有一部分是自己的理解 持续更新中
  • C语言---离散数学实验--图的基本概念及其应用

    目录 欧拉图的判定 实验内容 编辑 无向图的判断 算法展示 源码 有向图的判断 算法展示 源码 求欧拉路 算法展示 整体源码 对无向图的判断 对有向图的判断 二叉树的应用 源码 源码下载 实验目的 掌握判断欧拉图的方法 掌握求最优二叉树的方
  • kubeadm常用

    kubeadm常用 配置kubeadm自动补全 初始化一个master节点 导出kubeadm默认配置文件 将node节点加入集群 生成node配置 升级k8s版本 kubeadm升级node 维护或下线node节点 管理kubeadm j
  • 1-2 VS2019常用调试方法(断点设置、条件断点、调试按钮、逐过程、逐语句、监视变量、快速监视)

    文章目录 前言 1 打印数据 2 普通断点 2 1断点快捷键 3 条件断点与条件追踪 4 单步调试 5 添加监视 5 1快速监视 前言 主要调试方法 1 打印数据 2 普通断点 3 条件断点与条件追踪 4 单步调试 5 添加监视 1 打印数
  • JavaWeb自我学习——Request(请求)

    目录 Request 1 继承体系 2 获取请求数据 通用方式获取请求参数 idea模板创建servlet 请求参数中文乱码处理 Tomcat 8 0之后 已将GET请求乱码问题解决 设置默认的解码方式为UTF 8 3 请求转发 请求转发资
  • 中小企业在数字化转型上所面对的问题都有哪些?_光点科技

    随着科技的飞速发展 数字化转型已经成为企业持续发展的必由之路 尤其是中小企业 数字化转型不仅可以提高效率 降低成本 还可以拓展市场 增强竞争力 然而 数字化转型并非一帆风顺 中小企业在这个过程中面临着一系列挑战和问题 1 资金问题 中小企业
  • fb设备驱动1:fb设备的显像原理和步骤

    lcd的显像原理 将DDR内存的一部分划分出来作为显存 显存与lcd显示屏幕之间做一个双向的映射 然后用户只需要将需要显示的内容放入显存之中 然后显存中的内容就会刷新到lcd的储存器中进行显示 显存 在内核之中申请一块内存作为显存 由于内核
  • #ifndef/#define/#endif使用详解

    想必很多人都看过 头文件中的 ifndef define endif 防止该头文件被重复引用 但是是否能理解 被重复引用 是什么意思 是不能在不同的两个文件中使用include来包含这个头文件吗 如果头文件被重复引用了 会产生什么后果 是不
  • spring之AOP总结

    AOP Aspect Oriented Programming 面向切面编程 指在程序运行期间 将某段代码动态的切入到指定方法的指定位置进行运行的这种编程方法 面向切面编程 专业术语 连接点 即指定位置 spring允许你使用通知的地方 每
  • 哈希表以及用js封装一个哈希表

    最近在学数据结构和算法 正好将学习的东西记录下来 我是跟着一个b站博主学习的 是使用js来进行讲解的 待会也会在文章后面附上视频链接地址 大家想学习的可以去看看 本文主要讲解哈希表 其他数据结构后续学完也会持续更新 目录 一 什么是哈希表
  • 8 种最坑的SQL错误用法

    点击上方 芋道源码 选择 设为星标 管她前浪 还是后浪 能浪的浪 才是好浪 每天 10 33 更新文章 每天掉亿点点头发 源码精品专栏 原创 Java 2021 超神之路 很肝 中文详细注释的开源项目 RPC 框架 Dubbo 源码解析 网
  • 解决Windows10提示管理员已阻止你运行此应用的问题

    近日发现Windows10更新后 想查看设备管理器 在此电脑上右键点击管理后 提示 用户账户控制 管理员已阻止你运行此应用 无法打开管理 后来又发现很多重要的地方都出现这个提示 于是在网上找如何解决这个问题的办法 大部分都是修改注册表或者打
  • React的函数编程

    函数式编程的好处是什么 函数式编程是一种编程模式 在这种编程模式种最常用函数和表达式 函数式编程把函数作为一等公民 强调从函数的角度考虑问题 函数式编程倾向用一系列嵌套的函数来解决问题 函数式编程让我们的代码更清晰 每个功能都是一个函数 函
  • 「分享」最全AI合集 全是好玩意!

    哈喽 大家好 木易巷这次给大家带来了最全的AI合集 每一个都功能强大 总有一个是你需要的 话不多说 直接上 1 学英语 Replika 2 Al生成乐曲 AmperMusic IBM Watson Music 3 Al换脸 Deepfake
  • 一款好用的基于vue的录屏插件recordrtc,拿走不谢

    第一步 下载安装包 npm i recordrtc 第二步 复制代码 即可使用
  • c语言--unsigned修饰符

    在C语言中 unsigned是一种无符号整数修饰符 它可以与多个整数类型 如int short long等 结合使用 表示该整数类型只包含非负数值 unsigned修饰的整数类型不保存正负号位 因此可以用来表示更大的正整数范围 例如 uns
  • 静态代码扫描(四)——Java资源关闭研究

    最近一直在研究java资源关闭的检查规则 发现市面上开源的工具针对资源关闭的检测都存在一定不足 同时也无法满足我们业务的需求 所以火线团队针对资源关闭进行了深度的研究 取得了一些不错的进展 但是过程的艰辛也远超了我们的预料 现在就跟大家聊聊
  • 爬虫中连接数据库,两种获取网页内容的方式,BeautifulSoup, 正则表达式的使用,爬json格式文件

    一 连接数据库 1 连接MySQL import pymysql conn pymysql connect host localhost port 3306 user root passwd db charset utf8 cur conn
  • Multi-Camera Support

    Android 9 introduces API support for multi camera devices via a new logical camera device composed of two or more physic
  • 豪斯多夫距离-- Hausdorff distance of convex polygons

    蒙特利尔的麦吉尔大学的计算几何课程资料 原文链接 http cgm cs mcgill ca godfried teaching cg projects 98 normand main html 1 Introduction When ta

随机推荐

  • 总结 图(有向图、无向图、权、度、存储结构、邻接矩阵、领接表 概念)

    20171124 图的概念 图的基本性质 无向图 有向图 连通图 图的权 有些图的边或者狐剧有与他相关的数字 这种与图的边或者狐相关的数叫做权 图的度 无向图顶点的边数叫度 有向图顶点的边数叫出度和入度 图的数据存储结构 邻接矩阵 带权邻接
  • qt 获取当前程序运行路径_linux设置软件运行时动态库查找路径

    用习惯了windows 在linux下写代码 涉及到动态库 总是要复制到 usr lib里 觉得不方便 特别是调试的时候 不想复制过 特地找了一下怎么设置动态库查找路径 这里记录一下 程序是通过环境变量LD LIBRARY PATH的路径来
  • Exception in thread “main“ ExitCodeException exitCode=-1073741515

    Exception in thread main ExitCodeException exitCode 1073741515 今天在本地使用Mapreduce执行单词计数时出现了问题 在网上进行方法查找方法 首先 我先尝试将hadoop安装
  • linux信号介绍

    信号介绍 信号的概念 信号是信息的载体 Linux UNIX 环境下 古老 经典的通信方式 现下依然是主要的通信手段 信号在我们的生活中随处可见 例如 古代战争中摔杯为号 现代战争中的信号弹 体育比赛中使用的信号枪 信号的特点 简单 不能携
  • 【扩展KMP】POJ_3450| HDU_2328 Corporate Identity

    原题直通车 POJ 3450 Corporate Identity HDU 2328 Corporate Identity 题意概述 找出N个串中最长公共子串 分析 一 可以直接枚举其中一个串的所有字串 跟所有串进行匹配找到结果 二 用其中
  • IDEA(Ultimate版本)安装全程照着箭头指示

    只需动手跟着箭头指示安装即可 安装包的链接 https pan baidu com s 12hSGc7PDpbcaV UxCL5NSQ 提取码 zx1x 下载后解压自己想要的位置 安装完后可删除 以上就是安装全过程 如有问题可在评论区留言
  • 2023-05-19 题目

    1 java的三大特性 亦或者四大特性 继承 继承是从已有类得到继承信息创建新类的过程 提供继承信息的类被称为父类 超类 基类 得到继 承信息的类被称为子类 派生类 继承让变化中的软件系统有了一定的延续性 同时继承也是封装程序中可变因素的
  • <<计算机视觉CVPR>>2022:Grounded Language-Image Pre-training

    收录情况 CVPR 2022 论文链接 https arxiv org abs 2112 03857 代码链接 https github com microsoft GLIP 文章目录 简介 问题 方案 主要贡献 相关工作 方法 Groun
  • 12款开源或免费的3D建模软件

    1 Blender Blende是一款系统全面的3D建模套件 它提供了大量专业级功能和模块 跨平台支持所有的主要操作系统 目前并已成为免费3D软件的代名词 Blender通常被称为TheBlenderProject 因为它不仅仅是一个软件
  • Python 基础合集13:错误的调试和处理

    一 前言 本小节介绍了错误的调试和处理 包含了寻找出现bug的代码的方法 以及处理bug的方法 另外还附加了一些错误类型 环境说明 Python 3 6 windows11 64位 二 调试 找出错误 之前看到一句话 很在理 出错并不可怕
  • 汇编, 立即数, 有符号与无符号数

    汇编 立即数 有符号与无符号数 386 model flat stdcall option casemap none includelib msvcrt lib printf proto c ptr sbyte vararg data sz
  • C++语法总结

    1 const 与volatile 的用法 1 const include
  • 传统直线检测算法与基于深度学习的直线检测算法

    传统直线检测算法与基于深度学习的直线检测算法 提示 科大讯飞算法面试题 加入一个图像有一条很明显的直线划痕 怎么用传统图像处理去掉划痕 就是直线检测 文章目录 传统直线检测算法与基于深度学习的直线检测算法 TOC 文章目录 啥是直线检测 传
  • 【Python蓝桥杯】01字串 对于长度为5位的一个01串,每一位都可能是0或1,一共有32种可能。它们的前几个是: 00000 00001 00010 00011 00100 请按从小到大的顺序输出

    最近在刷蓝桥杯题目 按题目做一下笔记整理 顺便分享交流一下 有更好的解决方案欢迎大家共同提出探讨 以下源代码为系统提交满分答案 01字串 问题描述 资源限制 Python时间限制 5 0s 问题描述 对于长度为5位的一个01串 每一位都可能
  • JS数据结构与算法知识点--->字典

    此数据结构算法知识点系列笔记均是看coderwhy老师视频整理得出 字典一般是基于哈希表 后续学习 实现 数组 字典 集合 是几乎编程语言都会默认提供的数据类型 特点 一 一对应的关系 使用字典的方式 可以通过key取出value 键值对
  • SolidWorks装配体中子装配体无法移动的问题

    SolidWorks装配体中子装配体无法移动的问题 问题描述 问题解决 问题描述 有时候在一个装配体中有一个子装配体 这个子装配体没有被完全定义 子装配体之间的零件是可以相互移动的 但是在装配体中子装配体中的零件不可以相互移动 如下图 问题
  • CAN总线的报文分析(三)

    系列文章目录 文章目录 系列文章目录 前言 一 数据帧 最常用 1 帧起始 2 仲裁段 3 控制段 4 数据段 5 CRC段 6 ACK段 7 帧结束 二 远程帧 三 错误帧 四 过载帧 五 帧间隔 总结 前言 CAN总线上的节点发送数据都
  • Python for 3dMax加载图像文件并读取像素值

    使用Python for 3dMax加载和显示图像文件的示例 在这种情况下 EXR图像文件与3dMax文件位于同一目录中 from MaxPlus import BitmapManager image file path r BG park
  • 【编程笔试】美团2021校招笔试-通用编程题第5场(附思路及C++代码)

    导览 练习地址 修改大小写 式子求值 争夺地盘 公司管理 总结 练习地址 点此前往练习 修改大小写 在小美的国家 任何一篇由英文字母组成的文章中 如果大小写字母的数量不相同会被认为文章不优雅 现在 小美写了一篇文章 并且交给小团来修改 小美
  • 爬虫小项目

    爬取同花顺官网中的数据 共四页 项目适合练手 最终保存在csv文件中 尚有缺点 先发出来 一起探讨 qq 2385455226 欢迎来访 import requests from lxml import html headers Accep