使用 JSoup 提取 HTML 表格内容

2024-03-27

如何提取位于以下位置的表的内容: /id/2/year/2012/acc-conference">http://espn.go.com/mens-college-basketball/conferences/stands//id/2/year/2012/acc-conference

我见过的几个例子并不太清楚如何获取表的内容。有人可以提供任何帮助吗?


您现在可能已经解决了这个问题,但这将遍历每个表格并打印出团队名称和赢/输列。调整您需要的信息。第二个表的格式显然不同,因此如果您想要该表中的不同信息,则必须进一步调整。如果您需要更多帮助,请告诉我。

    Document doc = Jsoup.connect("http://espn.go.com/mens-college-basketball/conferences/standings/_/id/2/year/2012/acc-conference").get();

    for (Element table : doc.select("table.tablehead")) {
        for (Element row : table.select("tr")) {
            Elements tds = row.select("td");
            if (tds.size() > 6) {
                System.out.println(tds.get(0).text() + ":" + tds.get(1).text());
            }
        }
    }
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

使用 JSoup 提取 HTML 表格内容 的相关文章

  • 使用 Jsoup 从 html 文件中提取标签

    我正在对网络文档进行结构分析 为此 我只需要提取网络文档的结构 仅标签 我找到了一个名为 Jsoup 的 java html 解析器 但我不知道如何用它来提取标签 Example this is head this is body Outp
  • 使用 JSOUP 从网页检索有用信息

    我如何从万维网中的任何网页的 JAVA 页面的 页脚 部分检索 联系我们 链接 例如 查找页脚元素 或 id footer 或具有页脚类的元素 我曾尝试使用 JSOUP 从网页检索所有链接 然后运行正则表达式 contact 在里面 但我不
  • Jsoup div[class=] 语法有效,而 div.class 语法无效 - 为什么?

    对于以下 HTML 片段 div class class one class two class three classfour classfive classsix some inner content div 以下 Jsoup 选择器w
  • NullPointerException 解析 Jsoup

    我在使用 Jsoup 解析网站时遇到 NullPointerException 解析的实际网页会根据用户输入而变化 本质上 网页上有时有图像 有时没有 Document doc Jsoup connect http www forbes c
  • 使用 Jsoup 从网页中提取语言

    例如我有 web page 我想用 Jsoup 提取字符串 en 我尝试使用选择器和属性但没有成功 Document htmlDoc Jsoup parse html Element taglang htmlDoc select html
  • 尽管实际和预期相同,但 JUnit 给出 ComparisonFailure

    我正在尝试使用 Jsoup 解析网站中的字符串 并编写以下测试来验证解析 这是我的测试 Test public void extractBookData throws Exception String bookLink some addre
  • Jsoup,在执行表单POST之前获取值

    这是我用来提交表单的代码 Connection Response res Jsoup connect http example com data id myID data username myUsername data code MyAu
  • 使用 Jsoup 和适当的 cookie 登录 Facebook

    我目前正在尝试自动废弃我自己的主页以及我登录 Facebook 时可以访问的其他可能页面 但是 在使用下面的代码并设置 cookie 后 我似乎无法 登录 Connection Response res Jsoup connect http
  • 解析 FlightRadar24 和 JSOUP

    大家好 我想在 Flightradar24 com 上解析航班 我尝试过 JSOUP 和 Android 但结果为空 http postimg org image 6hdmp4hgv http postimg org image 6hdmp
  • 如何使用JAVA从html页面获取表格

    我正在开发一个项目 尝试从互联网获取财务报表并在 JAVA 应用程序中使用它们来自动创建比率和图表 我正在使用的网站使用登录名和密码才能进入牌桌 标签是 TBODY 但 html 中还有另外 2 个 TBODY 如何使用 java 将表打印
  • Java编译器不会自动优化字符串连接?

    下列Jsoup http jsoup org apidocs org jsoup nodes Element html text 28 29代码连接容器中所有元素的文本els for Element el els entireText el
  • 使用 jsoup 或 gquery 获取纯 XML

    我最近想知道有没有一个好的 Java 中 XML 操作库 一个不错的 Java XML DOM 实用程序 https stackoverflow com questions 6996013 a nice java xml dom utili
  • Jsoup 未下载整个页面

    网页是 http www hkex com hk eng market sec tradinfo stockcode eisdeqty pf htm http www hkex com hk eng market sec tradinfo
  • JSoup.clean() 不保留相对 URL

    我努力了 Whitelist relaxed Whitelist relaxed preserveRelativeLinks true Whitelist relaxed addProtocols a href http https mai
  • 如何将 Jsoup(Java html 解析器)中生成的文档转换为字符串

    我有一个用 jsoup 制作的文档 如下所示 Document doc Jsoup connect http en wikipedia org get 我该如何转换它doc成字符串 你有没有尝试过 Document doc Jsoup co
  • 如何从网页(内的选项卡)的 HTML 页面源中提取数据?

    我尝试过其他答案中指定的几种解决方案 例如尝试不同的用户代理 Chrome safari 等 以及使用 HTTPClient 和 BufferedReader 直接获取 HTML 但它们都不起作用 如何使 Android 输出与 Web 输
  • 如何让jsoup等待完整页面(跳过进度页面)加载? [复制]

    这个问题在这里已经有答案了 我正在尝试使用 Jsoup 解析网页并提取数据 但该链接是动态的 在显示详细信息之前会弹出一个等待加载的页面 所以Jsoup似乎处理的是等待页面而不是详情页面 有没有办法让这个等到页面完全加载 如果页面加载后动态
  • JSoup 不适用于 AsyncTask

    我注意到我的应用程序发生了一件有趣的事情 我在 AsyncTask 中使用 Jsoup 之后我的应用程序崩溃了 LogCat 是 12 15 11 16 43 023 I dalvikvm 371 Could not find method
  • 外部库会使应用程序变慢吗?

    我正在构建一个从网页中抓取信息的应用程序 为此 我选择使用一个名为的 html scraperJsoup http jsoup org 因为它使用起来非常简单 Jsoup 还依赖于 Apache Commons Lang 库 它们总计 38
  • 带负载的 Jsoup HTTP POST

    我正在尝试通过 jsoup 发出此 HTTP 请求here http developer decarta com Docs REST BatchRequests http api decarta com v1 KEY batch reque

随机推荐

  • 椭圆弧箭头边缘d3力布局

    我正在使用强制布局来创建有向图 它渲染在画布上 我的示例位于http jsbin com vuyapibaqa 1 edit html 输出 http jsbin com vuyapibaqa 1 edit html output 现在我的
  • 无法在 DayNight 主题中动态切换模式

    我在我的应用程序中实现了 DayNight 主题 并添加了一个在白天和夜间模式之间切换的设置 但如果不重新启动 我无法在模式之间动态切换 如果我使用setDefaultNightMode 设置更改后 设置活动不会更改模式 但后台堆栈中的活动
  • VS Code 中的 SQL 调试

    我已经在 Windows 上安装了 VS code 工具并探索其功能 到目前为止 我想说它是一个很棒的工具 与传统的 SSMS 相比 它具有一些很酷的功能 我面临的困难是 在 VS Code 中使用 debug 当我单击调试时 它会在活动栏
  • C:执行 {...} while(0)? [复制]

    这个问题在这里已经有答案了 可能的重复 为什么 C C 宏中有时会出现无意义的 do while 和 if else 语句 https stackoverflow com questions 154136 why are there som
  • 为什么 SQL Server 2008 Management Studio Intellisense 不工作?

    我正在疯狂地试图找出为什么智能感知根本无法工作 我使用的服务器是本地的 并且是 2008 年的 数据库设置为 2008 兼容性 智能感知在我能找到的每个菜单中都打开 但即使使用 CTRL J 也不会弹出任何成员列表 有没有人经历过类似的事情
  • Chrome Timeline 开发工具中的图像解码时间

    我正在构建一个视差滚动网站 不是我们所有人吗 除其他外 它会在用户滚动时显示图像 我通过将图像放在背景中并在顶部放置一个实心填充的 div 来完成 显示 然后 我根据滚动位置将该 div 从 100 高度设置为 0 高度 从而显示背景图像
  • 是否可以在 ng 服务之前和 Angular 7 中的实时重新加载/自动重新加载之前运行自定义脚本?

    在从 Angular cli 启动 ngserve 命令之前以及在 Angular 实时重新加载 自动重新加载之前 我必须运行自定义脚本吗 除了修改 package json 之外 是否可以使用 Angular 7 找你的package j
  • 如何为实际使用数据库上下文的 ASP.NET Core 控制器编写单元测试?

    关于如何编写良好的单元测试的信息似乎很少actualASP NET Core 控制器操作 关于如何使这项工作真正发挥作用有什么指导吗 我有一个系统 现在似乎运行得很好 所以我想我应该分享它 看看它是否能帮助其他人 有一个实体框架文档中非常有
  • Neo4j 3.0 中的存储过程

    我在 Windows 上使用 neo4j 3 0 并尝试使用存储过程新功能 我已经构建了 apoc jargithub 来源 https github com neo4j contrib neo4j apoc procedures 该 ja
  • R ggplot2:如何绘制具有纯色和透明笔触并根据颜色着色的geom_points?

    我想制作一个散点图 其中每个点都有一个球体 点及其球体都根据某些列值着色 一个显示我想要的最小示例 library ggplot2 library vcd only needed for example dataset ggplot Art
  • c、unix 中的睡眠函数

    我需要导入什么才能在unix中使用睡眠功能 我知道windows 是windows h 但是unix 呢 它应该位于 unistd h 中 请注意 这只能提供整数秒的精度 亚秒精度最便携的方法应该是 ab 使用 select
  • node.js:在全局范围内使用“this”令人困惑

    我最近一直在玩弄node js 并且遇到了关于使用的奇怪行为this在模块的全局范围内 this在全局范围内绑定到 module exports console log this exports gt true But this在方法范围内
  • 模块“QtQuick.Dialogs”版本 1.3 未安装

    我正在尝试在运行 1 2 版时没有任何问题的代码中导入 QtQuick Dialogs 1 3 版 但是在运行时我收到以下错误 模块 QtQuick Dialogs 版本 1 3 未安装 我正在使用默认的 Desktop Qt 5 9 2
  • 如何安全地读取 ASP.NET 中的流?

    byte bytes new byte uploader UploadedFiles 0 InputStream Length uploader UploadedFiles 0 InputStream Read bytes 0 bytes
  • Eclipse makefile 构建速度很慢...是什么原因?

    我们是 Eclipse 的狂热粉丝 这太棒了 但我们有大约 40 个 C 项目 并且还在不断增长 当所有项目都是最新的时 构建所有这些项目大约需要半分钟 总共 如果我只是创建一个对所有 40 个项目执行 make all 的 bash 脚本
  • 为什么 golang 左移 64 位不会溢出?

    我正在看围棋之旅 https tour golang org basics 11我对 basic types go 示例中的某些内容感到困惑 MaxInt uint64 1 lt lt 64 1 在无符号 64 位整数中向左移动 1 64
  • React 测试库:何时使用 userEvent.click 以及何时使用 fireEvent

    我目前正在学习 React Testing Library 我想测试鼠标与元素的交互 目前我还不清楚 userEvent click element 和 fireEvent click element 之间的区别 两者都建议使用吗 在下面的
  • 无法连接到生产 Apple 推送通知服务器

    我们使用开发认证和 gateway sandbox push apple com 向配置的设备发送通知没有任何问题 但现在我们的应用程序已在商店中 看来我们甚至无法连接到生产 apn 服务器 gateway push apple com 来
  • Android singletop 单实例和单任务

    我在为不同的活动实现不同类型的启动模式时遇到设计问题 我有 5 项活动 视频列表 视频详情 收藏夹列表 视频搜索 视频播放器 当用户启动应用程序时 它会转到显示视频列表的 VideoList 单击任何视频会将它们带到视频详细信息 该页面中有
  • 使用 JSoup 提取 HTML 表格内容

    如何提取位于以下位置的表的内容 id 2 year 2012 acc conference gt http espn go com mens college basketball conferences stands id 2 year 2