将 html 表转换为 pandas 数据框

2023-12-28

我一直在尝试从网站导入 html 表并将其转换为 pandasDataFrame。这是我的代码：

import pandas as pd
table = pd.read_html("http://www.sharesansar.com/c/today-share-price.html")
dfs = pd.DataFrame(data = table)
print dfs

它只是显示这个：

0       S.No                                     ...

但如果我这样做了；

for df in dfs:
    print df

它输出表..

我该如何使用pd.数据框刮桌子？

给定 url 上的 HTML 表是由 javascript 呈现的。pd.read_html()不支持 javascript 渲染页面。你可以尝试使用dryscrape https://dryscrape.readthedocs.io/en/latest/像这样：

import pandas as pd
import dryscrape

s = dryscrape.Session()
s.visit("http://www.sharesansar.com/c/today-share-price.html")
df = pd.read_html(s.body())[5]
df.head()

Output:

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

quantitativefinance

将 html 表转换为 pandas 数据框的相关文章

Virtualenv 在 OS X Yosemite 上失败并出现 OSError

我最近更新到 OSX Yosemite 现在无法使用virtualenv pip 每当我执行 virtualenv env 它抛出一个 OSError Command Users administrator ux env bin pytho
Mypy 无法从文字列表推断项目的类型

我有一个变量x和一个文字列表例如 0 1 2 我想转换x这些文字之一如果x在列表中我将其退回否则我返回一个后备值 from typing import Literal Set Foo Literal 0 1 2 foos Set F
使用 Boto3 以字符串形式打开 S3 对象

我知道使用 Boto 2 可以使用以下命令将 S3 对象作为字符串打开 get contents as string http boto readthedocs org en latest ref file html highlight c
Matplotlib：如何有效地将大量线段着色为独立渐变

Python 绘图库如何有效地将大量线段着色为独立渐变已经阅读this https stackoverflow com questions 8500700 how to plot a gradient color line in ma
创建上下文后将 jar 文件添加到 pyspark

我正在笔记本上使用 pyspark 并且不处理 SparkSession 的创建我需要加载一个包含一些我想在处理 rdd 时使用的函数的 jar 您可以使用 jars 轻松完成此操作但在我的特定情况下我无法做到这一点有没有办法访问sp
如何使用scrapy检查网站是否支持http、htts和www前缀

我正在使用 scrapy 来检查某些网站是否工作正常当我使用http example com https example com or http www example com 当我创建 scrapy 请求时它工作正常例如在我的pa
python 中的 <> 运算符有什么作用？

我刚刚遇到这个here http www feedparser org feedparser py 总是这样使用 if string1 find string2 lt gt 1 pass 什么是 lt gt 运算符这样做为什么不使用通常的
运行 Python 单元测试，以便成功时不打印任何内容，失败时仅打印 AssertionError()

我有一个标准单元测试格式的测试模块 class my test unittest TestCase def test 1 self tests def test 2 self tests etc 我的公司有一个专有的测试工具它将作为命令行
Paste.httpserver 并通过 HTTP/1.1 Keep-alive 减慢速度；使用 httperf 和 ab 进行测试

我有一个基于paste httpserver 的Web 服务器作为HTTP 和WSGI 之间的适配器当我使用 httperf 进行性能测量时如果每次使用 num conn 启动一个新请求我每秒可以执行超过 1 000 个请求如果我使
使用 for 循环创建一系列元组

我已经搜索过但找不到答案尽管我确信它已经存在了我对 python 很陌生但我以前用其他语言做过这种事情我正在以行形式读取数据文件我想将每行数据存储在它自己的元组中以便在 for 循环之外访问 tup i inLine wher
Spark 和 Python 使用自定义文件格式/生成器作为 RDD 的输入

我想问一下 Spark 中输入的可能性我可以看到从http spark apache org docs latest programming guide html http spark apache org docs latest pro
Plotly：如何检查基本图形结构（版本 4）

对于旧版本的plotly 例如在 Jupyterlab 中您可以简单地运行figure像这样检查你的图形的基础知识 Ouput data marker color red size 10 symbol 104 mode markers l
是否需要关闭没有引用它们的文件？

作为一个完全的编程初学者我试图理解打开和关闭文件的基本概念我正在做的一项练习是创建一个脚本允许我将内容从一个文件复制到另一个文件 in file open from file indata in file read out file
Ubuntu systemd 自定义服务因 python 脚本而失败

希望获得有关 Ubuntu 中的 systemd 守护进程服务的一些帮助我写了一个 python 脚本来禁用 Dell XPS 上的触摸屏这更像是一个问题而不是一个有用的功能该脚本可以工作但我不想一直启动它这就是为什么我想到编写
可以使用哪些技术来衡量 pandas/numpy 解决方案的性能

Question 如何简洁全面地衡量下面各个功能的性能 Example 考虑数据框df df pd DataFrame Group list QLCKPXNLNTIXAWYMWACA Value 29 52 71 51 45 76 68 6
如何指示 urwid 列表框的项目数多于当前显示的项目数？

有没有办法向用户显示 urwid 列表框在显示部分上方下方有其他项目我正在考虑类似滚动条的东西它可以显示条目的数量或者列表框顶部底部的单独栏如果这个行为无法实现有哪些方法可以实现这个通知在我的研究过程中我发现这个问题 ht
Python bug - 或者我的愚蠢 - 扫描字符串文字时 EOL

我看不出以下两行之间有显着差异然而第一个解析而后者则不解析 In 5 n Axis of Awesome In 6 n Axis of Awesome File
minizinc python 安装

我通过 anaconda 提示符在 python 上安装了 minizinc 就像其他软件包一样 pip install minizinc 该软件包表示已成功安装我可以导入该模块但是我正在遵循基本示例https minizinc py
Django 管理器链接

我想知道是否有可能如果可以的话如何将多个管理器链接在一起以生成受两个单独管理器影响的查询集我将解释我正在研究的具体示例我有多个抽象模型类用于为其他模型提供小型的特定功能其中两个模型是DeleteMixin 和GlobalMix
IndexError - 具有匀称形状的笛卡尔 PolygonPatch

我曾经使用 shapely 制作一个圆圈并将其绘制在之前填充的图上这曾经工作得很好最近我收到索引错误我将代码分解为最简单的操作但它甚至无法执行最简单的循环 import descartes import shapely geome

随机推荐

MySQL UUID 主键 - 由 PHP 还是 MySQL 生成？

我的印象是让 MySQL 通过以下方式生成主键UUID 将使密钥在服务器之间唯一等等 But 无法获取最后插入的 UUID https stackoverflow com questions 9379282 php mysql inser
实体“nbsp”被引用，但未声明

我编写了一个 XSLT 将 xml 转换为 xml 输入 XML
LDAP 支持 BCrypt 吗？尝试在 Java Spring Security 中实现 BCrypt

我目前正在尝试在 Spring Security 中使用 LDAP 实现 BCrypt 我的问题是 LDAP 是否支持此功能如果支持我该如何实现查看下图我在 LDAP 透视图的密码编辑器视图中没有看到 BCrypt 作为选项我当前
如何将两个 Rust 向量按三块交织成一个新向量？

我需要一种惯用的方式来交错这两个向量 let v1 vec 1 0 2 0 3 0 4 0 5 0 6 0 let v2 vec 7 0 8 0 9 0 10 0 11 0 12 0 我期望的输出是 1 0 2 0 3 0 7 0 8 0
在 Angular JS 中使用 ng-click 更改另一个控制器中的按钮单选值

我有两个控制器一个过滤器控制器和一个显示控制器结果在第一个控制器中我有一组单选按钮当更改单选按钮时发送一个事件来更改第二个控制器中显示的值代码如下我知道第二个控制器中的评论不会立即更改 HTML div div
Android：Canvas 与 OpenGL

我有一个绘图应用程序用户可以用手指绘制线条调整颜色粗细等当用户绘图时我将集中的 X Y 点从MotionEvent into SVG 路径 http www w3 org TR SVG paths html 以及创建Android
Java 终端仅打印第一个命令的输出

编辑代码现在可以运行了我是这样做的 package me nrubin29 jterminal import javax swing import javax swing filechooser FileSystemView impor
为什么我需要在调用 NSArray 项目的方法之前进行强制转换？

我对 Objective C 还很陌生目前正在将我自己的库从 C Java 移植到 Objective C 我现在遇到了一个非常奇怪的问题我有一个NSArray与几个Note对象我想转置这些注释 Note h Note transpo
如何在不创建新行的情况下选择 SuperTab 补全建议？

当我在 SuperTab 的弹出建议上按 Enter 时它会自动在插入的关键字末尾创建一个新行是否可以在 SuperTab 弹出窗口中选择一个选项而不创建新行更具体地说有没有办法让我配置space作为选择代码完成建议的方法 inor
Boost 相当于 ManualResetEvent？

我想知道是否有相当于 ManualResetEvent 的提升基本上我想要一个跨平台的实现或者有人可以帮助我使用 Boost thread 模仿 ManualResetEvent 的功能吗多谢你们当您有互斥体和条件变量时编写手
使用 LAPACK 分发基于 Cython 的扩展

我正在编写一个包含 Cython 扩展和使用的 Python 模块LAPACK and BLAS 我愿意使用任何一个clapack or lapacke 或者某种f2c or f2py如有必要请提供解决方案重要的是我可以打电话lapac
C# 中在另一个类中声明的类

我正在处理一些遗留代码并遇到了一些我不确定的事情我们有一个class y在另一个内部声明的class x Class y只在内部使用过class x但我的问题是你为什么不创建一个单独的类文件并放入class y在那里而不是在里面声明它c
具体类的继承是邪恶的吗？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我对大多数类型使用接口抽象基类并且通常不从具体类继承但我最近遇到了需要继承或组合的情况我已经知道这句格言针对接口编程而不是实现但最
当只应该存在一个窗口时，Tkinter 在使用多重处理选择文件时打开多个 GUI 窗口

我有primary py from tkinter import from tkinter filedialog import askopenfilename from tkinter import ttk import multiproc
合并为零而不是空

我有一个简单的公司表它使用的列名不一致turnover and revenue 该表目前如下所示 company turnover revenue A 10000 0 B 0 2500 C 0 3000 4 23000 0 我知道如何使用
如何在jade中添加条件html标签？

In jade https github com visionmedia jade 我想根据条件放入一个 html 标签这个方法 http paulirish com 2008 conditional stylesheets vs css
在 Android 中，如何检测我的活动恢复的原因？

我正在开发一个活动它可以进行一些自己的状态管理我试图区分以下 onResume 情况新品上市任务切换 home键长按在同一应用程序中进行其他活动后恢复睡眠后醒来方向改变活动的意图或其他地方是否有某些东西可以帮助我区分这些出
使用翻转正交、字形顶部和基线之间的差异渲染 FreeType 文本

我正在开发一个项目在该项目中我实现了一个 FreeType 渲染对象来绘制文本其中渲染环境是用正交投影矩阵指定的 glm ortho 0 Width Height 0 这确保了坐标与标准 GUI 系统相似 0 0 是窗口的左上角而不是
mongodb 文档大小限制是否会从 16MB 增加？

文档大小从 4MB 增加到 16MB 2010年12月 https jira mongodb org browse SERVER 431 还会进一步增加吗如果是的话什么时候解决该大小的一项工作是通过创建更多集合并执行应用程序级别连接不
将 html 表转换为 pandas 数据框

我一直在尝试从网站导入 html 表并将其转换为 pandasDataFrame 这是我的代码 import pandas as pd table pd read html http www sharesansar com c today

将 html 表转换为 pandas 数据框

将 html 表转换为 pandas 数据框 的相关文章

随机推荐

热门标签

将 html 表转换为 pandas 数据框的相关文章