python selenium从新浪财经网抓取一家公司的高管任职信息写入excel表格

2023-11-05

网址：http://vip.stock.finance.sina.com.cn/corp/go.php/vCI_CorpManager/stockid/600900.phtml

在页面按f12打开开发者工具，在table标签上右键复制xpath

import xlwt
from selenium import webdriver

def main():
    # 网页链接
    url = "http://vip.stock.finance.sina.com.cn/corp/go.php/vCI_CorpManager/stockid/600900.phtml"
    # 文件存储路径和名字
    dirPath = "C:/Users/mcfly/Desktop/新道云/"
    dirName = "案例一.xls"
    # 表格xpath
    table1_xpath  ="//*[@id='comInfo1']"

    driver = webdriver.Chrome()
    driver.implicitly_wait(10)
    driver.get(url)
    # 把爬到的信息按行暂存在列表中
    data = []
    lst = []
    # 定位到表格
    table = driver.find_element_by_xpath(table1_xpath)
    # thead单独爬
    th_content = table.find_element_by_tag_name('thead').find_element_by_tag_name('tr').find_element_by_tag_name('th')
    lst.append( th_content.text )
    data.append( lst )
    # 遍历表格每一行，将内容存到列表中
    tr_contents = table.find_elements_by_tag_name('tr')
    for tr in tr_contents:
        td_contents = tr.find_elements_by_tag_name('td')
        lst = []
        for td in td_contents:
            lst.append(td.text)
        data.append(lst)
    print(data)
    # 创建表
    workbook = xlwt.Workbook(encoding='utf-8')
    # 创建sheet
    booksheet = workbook.add_sheet('Sheet 1', cell_overwrite_ok=True)
    # 存储路径
    filepath = dirPath + dirName
    row = len(data)
    col = len(lst)
    #将列表里的内容填到excel表格里，这里i从2开始是因为爬到的前两行是不需要的内容
    for i in range(2, row):
        for j in range(0, col):
            text = data[i][j]
            booksheet.write(i-2, j, text)
    # 保存到指定路径
    workbook.save(filepath)

if __name__ == '__main__':
    main()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

selenium

爬虫

python selenium从新浪财经网抓取一家公司的高管任职信息写入excel表格的相关文章

为什么Python中的打印需要三个撇号？

我正在用 Python 3 3 2 制作这个毕达哥拉斯定理计算器我打印了几行以便我可以制作图表 print Welcome to the Pythagoras Theorem Calculator powered by Python p
Python 解码 JSON 中的嵌套 JSON

我正在处理一个 API 不幸的是它返回了格式错误或奇怪的格式而是感谢 fjarri JSON 但从积极的一面来看我认为这可能是我学习一些有关递归以及JSON 这是我用来记录锻炼的应用程序我正在尝试制作备份脚本我可以很好地收到
将鼠标悬停在 Folium 的弹出窗口中

用这样一个简单的例子 import folium map 1 folium Map location 45 372 121 6972 zoom start 12 tiles Stamen Terrain folium Marker 45 3
AttributeError：“函数”对象没有属性“编译”

我一直面临这个属性错误有什么想法可以解决它吗 def model input shape model keras Sequential model add keras layers LSTM 64 input shape 1 9 retu
SQLAlchemy如何为同一个表定义两个模型

我有一个表其中一列是具有两个值的 varchar groupA groupB 当我创建模型时我想实现两件事 A 组模型包含 X 数量的相关函数 B 组模型包含 Y 数量的相关函数两个模型的功能并不相同尽管它们代表了same ta
Python + Selenium：驱动程序路径

是否有可能在不输入路径的情况下运行 Python Selenium 脚本exePython 行中每个脚本中的文件 driver webdriver Chrome 同样的问题也适用于 IE 驱动程序 Edge 驱动程序和 Gecko 驱动程
Tastypie：GET 的身份验证和 POST 的匿名

我使用 Django Tastypie 来管理我的用户集合是否可以允许匿名用户在 API 中发布在某个端点创建新用户时并限制经过身份验证的用户仅获取自己的用户而不是所有用户感谢您的帮助我发现最简单的事情就是对我正在使用的身份验证
对训练和测试数据帧使用相同的标签编码器

我有 2 个不同的 csv 其中包含训练数据和测试数据我从这些 train features df 和 test features df 创建了两个不同的数据帧请注意测试和训练数据有多个分类列因此我需要对它们应用 labelEnco
如何从数据存储区刷新 NDB 实体？

我希望能够在我的代码调用的测试中断言Model put 对于已修改的实体不幸的是似乎正在进行一些缓存例如以下代码 from google appengine ext import ndb class MyModel ndb Model
如何有效地找到两个轮廓集之间的所有交点

我想知道找到两组轮廓线之间所有交点舍入误差的最佳方法哪种方法最好这是示例 import matplotlib pyplot as plt import numpy as np x np linspace 1 1 500 X Y np
matplotlib 示例代码不适用于 python 虚拟环境

我正在尝试在 matplotlib 中显示图像的 x y z 坐标示例代码 http matplotlib org examples api image zcoord html在全局 python 安装上工作得很好当我移动光标时 x y
如何设置 pandas DataFrame _repr_html_ 方法的默认样式？

我有一个 pandas DataFrame 其中有一列是 url 并且我编写了以下格式化程序以将其作为链接呈现在我的笔记本中 def make clickable val target blank to open new window re
python中matlab find函数的替换

我正在尝试寻找合适的python函数来替代matlabfind在我的脚本和一些谷歌搜索中我看到np where 大多数时候都能解决目的但在双重条件的情况下我有不同的输出有人可以告诉我这种方法有什么问题以及如何继续吗示例代码和差异如下
Python条件运算符“if else”不等于“and or”[重复]

这个问题在这里已经有答案了我认为下面两个函数的结果会相同但事实并非如此 def fib2 n return n and n lt 2 or fib2 n 1 fib2 n 2 def fib3 m return m if m lt 2
如何在Python中生成0-1矩阵的所有可能组合？

如何生成大小为 K N 的 0 1 矩阵的所有可能组合例如如果我取 K 2 和 N 2 我会得到以下组合 combination 1 0 0 0 0 combination 2 1 0 0 0 combination 3 0 1 0 0
由 asyncio.new_event_loop 创建的事件循环挂起

以下代码只是挂起而不打印任何内容 import asyncio async def foo loop print foo loop stop loop asyncio new event loop asyncio ensure future
检查元素是否确实对用户可见

我想检查用户是否可以在不滚动的情况下看到当前网络浏览器视图中的元素我发现可以检查该元素是否位于页面上的某个位置另一个提示建议检查元素位置但随后我需要获取浏览器可见窗口的尺寸及其x y偏移到0 0 如果有人能给我指出一个不需要 Java
pandas 数据帧和聚合中的行明智排序

我在 pandas dataframe df 中有一个表 col1 col2 count 12 15 3 13 17 5 1 36 4 15 12 7 36 1 4 等等我想要的是将 12 和 15 和 15 和 12 等计算值视为相同
在 AWS ec2 实例上使用“sudo pip”时出现错误

我正在尝试在 aws ec2 实例上运行一个小型 python 代码需要 pytz 和其他一些包当我尝试安装 pytz 时出现一些错误 ec2 user ip 172 31 28 178 pip install pytz Collec
Doctest 返回失败，但“预期”和“得到”完美匹配

我正在尝试做列表部分的第二个练习 http www openbookproject net thinkcs python english2e ch09 html exercises 如何像计算机科学家一样思考一书的内容我基本上必须将给定

随机推荐

抓包工具mitmprox

安装我这里是在pycharm下项目setting安装的设置环境变量将下面exe这个路径添加至path 启动mitmproxy https blog csdn net shifengboy article details 1140672
北邮22信通：实验五共射放大电路的频率特性与深负反馈的影响

北邮22信通一枚很高兴以一个新身份与大家见面关注作者解锁更多邮苑模电实验报告获取更多文章请访问专栏北邮22信通电子电路青山如墨雨如画的博客 CSDN博客目录实验目的实验设备及器件实验内容 1 频率特性分析 1 1 C
C# linq初探使用linq查询数组中元素

使用linq进行数组查询输出数组中全部的偶数并升序输出结果写法1 int numbers 5 10 8 3 6 12 查询的数组 var numqurey from num in numbers where num 2 0 按照条件过滤
区间预测

区间预测 MATLAB实现SARIMA季节性数据时间序列预测 arima函数目录区间预测 MATLAB实现SARIMA季节性数据时间序列预测 arima函数预测效果基本介绍研究回顾模型结构程序设计参考资料预测效果基本介绍
latex 基本用法（二）—— 矩阵（增广矩阵、长虚线）

latex 基本用法 modm mod m mod modn pmod n pmod 1 增广矩阵比如鸡兔同笼问题的线性方程组 x y 152x 4y 40 begin split x y 15 2x 4y 40 end split 首先
android 自定义控件--（圆盘形菜单控件）

思路原理定一个原点和一个半径圆的四周均匀分布每个菜单为了方便计算菜单的坐标用度数表示然后转化为极坐标计算定某个点为起始点根据总菜单数确定每个点增加的度数然后依次确定每个点的度数也就确定了坐标源代码 package chr
linux下C语言修改文件权限

头文件
Java 统计文本文件中字符数量

设有一个文本文件word01 txt 内容如下 after a minute or two and said to his friend he opened them again a minute or two and said to fr
【数据结构——树】Trie树的两种实现方式：二叉树（左孩子右兄弟）与二十六叉树

输入输入的第一行为一个正整数n 表示词典的大小其后n行每一行一个单词不保证是英文单词也有可能是火星文单词哦单词由不超过10个的小写英文字母组成可能存在相同的单词此时应将其视作不同的单词接下来的一行为一个正整数m 表示询问的
c++实现哈夫曼huffman压缩文本

哈夫曼压缩原理就是构建二叉树出现频率高的字母用更少的位数来表示实现压缩的效果比如字符串abcbbc 构建哈夫曼树这样构建出编码表b gt 0 a gt 10 c gt 11 原本6个字符要48位来表示现在只需要9位来表示即可 1
FairyGui简单介绍

1 什么是FairyGui 跨平台UI编辑器支持多种项目如Unity Cocos2dx CryEngine HavokVision Starling Egret LayaAir Haxe Pixi LibGDX and More 2 a
视频号的播放量和互动率、完播率密不可分

如何提高视频号播放量视频号是推荐机制分两种社交推荐朋友给你点赞我未关注也可能刷到你和平台推荐提高系统推荐的两个指标和一个逻辑两个指标互动率和完播率 1 互动率互动率是指互动次数占总播放量的比重包含点赞率评论率转发
算法 - 递归实现汉诺塔（The Tower of Hanoi）

目录引言分析分析两片汉诺塔的迁移过程分析三片汉诺塔的迁移过程代码实现递归出口递归过程完整程序代码运行结果参考资料引言今天接触到了一个非常有意思的游戏名字叫做汉诺塔 Tower of Hanoi 小时候没有玩过这个益
web爬虫学习（四）——手机APP爬取

思路如下 STEP1 为我们的爬虫找到入口笔者是一个痴迷于挖掘数据中的价值的学习人希望在平日的工作学习中挖掘数据的价值找寻数据的秘密笔者认为数据的价值不仅仅只体现在企业中个人也可以体会到数据的魅力用技术力量探索行为密码让大
TFTP常用命令

一上传到指定文件夹 tftp p l file target ip 这里的file可以是一个目录如 C User Administrator Documents 二下载到当前目录 tftp g r file source ip 这里的
webug 4.0 第十关存储型xss

感谢webug团队一直以来的更新维护 webug是什么 WeBug名称定义为我们的漏洞靶场环境基础环境是基于PHP mysql制作搭建而成中级环境与高级环境分别都是由互联网漏洞事件而收集的漏洞存在的操作环境部分漏洞是基于Window
将在数组中的对象的 key，做替换

固定更换个别 key key1 映射 stroke value 替代值不变比如 value 的 stroke const arrayOfObj key1 value1 key2 value2 key1 value1 key2 value2
什么是CSS权重值？CSS权重值的优先级是什么？

什么是CSS的权重值 1 权重决定了你css规则怎样被浏览器解析直到生效 css权重关系到你的css规则是怎样显示的 2 当很多的规则被应用到某一个元素上时权重是一个决定哪种规则生效或者是优先级的过程 3 每个选择器都有自己的权重你的
华为OD机试 - 矩阵最大值（Python）

题目描述给定一个仅包含0和1的N N二维矩阵请计算二维矩阵的最大值计算规则如下 1 每行元素按下标顺序组成一个二进制数下标越大越排在低位二进制数的值就是该行的值矩阵各行值之和为矩阵的值 2 允许通过向左或向右整体循环移动每行元素
python selenium从新浪财经网抓取一家公司的高管任职信息写入excel表格

网址 http vip stock finance sina com cn corp go php vCI CorpManager stockid 600900 phtml 在页面按f12打开开发者工具在table标签上右键复制xpath

python selenium从新浪财经网抓取一家公司的高管任职信息写入excel表格

python selenium从新浪财经网抓取一家公司的高管任职信息写入excel表格 的相关文章

随机推荐

热门标签

python selenium从新浪财经网抓取一家公司的高管任职信息写入excel表格的相关文章