Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
jsoup 仅去除 html 标签而不去除换行符?
我在 Java 中有以下内容 我只想删除 html 标签而不是换行符 p test1 b test2 b test 3 p line 1 p test4 p line 2 如果我在文本富编辑器中打开以上内容 第 1 行和第 2 行将显示在不
Java
html
Jsoup
endofline
如何使用 Jsoup 获取此文本?
如何使用 Jsoup 从以下 html 代码中获取 此文本 h2 class link title a href myhref html this text img width 10 height 10 src img jpg span c
Java
cssselectors
htmlparsing
Jsoup
Jsoup.connect() 适用于 Java,不适用于 Android
我已经尝试过Jsoup connect Jsoup 网站上给出的示例 它在 Java 中运行良好 由于某种原因 即使我在我的项目中允许互联网访问权限 我也无法使其在 Android 项目 Eclipse 中工作AndroidManifest
Android
Jsoup
Jsoup - 如何通过转义而不删除不需要的 html 来清理 html?
有没有办法让 jsoup 通过转义不需要的 HTML 而不是完全删除它来清理包含 HTML 的字符串 我的例子 String dirty This is b REALLY b dirty code from a href www rubbi
Jsoup
安装 JAR 文件
我刚刚下载了 Jsouphttp jsoup org download http jsoup org download jsoup 1 7 2 jar 问题很简单 如何安装 安装最新的 JRE 版本后 我已经尝试过右键单击 gt 打开方式
Java
jar
installation
Jsoup
如何使用 jsoup 替换标签
我想将所有图像标签替换为div标签 我可以选择所有标签 并且我知道我必须使用replaceWith 但我无法使用它 如果我使用TextNode替换为 div div 它转换成 amp lt div amp gt my div amp lt
html
Jsoup
Jsoup 解析带有 tbody 标签的 Html 文件
我最近在 tbody 标签方面出现了不一致的 Jsoup 行为 当我使用如下 Html 结构解析网络上的远程页面时 table tbody tr td text td tr tbody table Jsoup 在 select 方法 返回的
Jsoup
无法使用带有 x-www-form-urlencoded 参数的 JSOUP 登录网站
我如何使用来实现以下请求Jsoup http jsoup org POST 登录 用户 HTTP 1 1主机 url publishedprices co il缓存控制 无缓存 内容类型 application x www form url
Java
Jsoup
尽管实际和预期相同,但 JUnit 给出 ComparisonFailure
我正在尝试使用 Jsoup 解析网站中的字符串 并编写以下测试来验证解析 这是我的测试 Test public void extractBookData throws Exception String bookLink some addre
Java
JUnit
Jsoup
使用 Jsoup 从网页中提取语言
例如我有 web page 我想用 Jsoup 提取字符串 en 我尝试使用选择器和属性但没有成功 Document htmlDoc Jsoup parse html Element taglang htmlDoc select html
Java
Jsoup
页面内容是用 JavaScript 加载的,而 Jsoup 看不到它
页面上的一个块由 JavaScript 填充内容 并且在使用 Jsoup 加载页面后 没有任何信息 有没有办法在解析页面时也获取 JavaScript 生成的内容Jsoup 无法在此处粘贴页面代码 因为它太长 http pastebin c
Java
html
webscraping
Jsoup
NullPointerException 解析 Jsoup
我在使用 Jsoup 解析网站时遇到 NullPointerException 解析的实际网页会根据用户输入而变化 本质上 网页上有时有图像 有时没有 Document doc Jsoup connect http www forbes c
Java
Android
NullPointerException
htmlparsing
Jsoup
如何使用jsoup限制下载大小?
我正在尝试使用 JSoup 限制下载页面 链接的大小 如下所示 Scala 代码 val document Jsoup connect theURL get 我只想获取给定页面的前几 KB 并停止尝试下载超出该范围的内容 如果有一个非常大的
Jsoup
从 cookiesyncmanager 进行 Jsoup cookie 身份验证以从 https 站点抓取
我有一个使用 webview 的 android 应用程序 用户必须使用用户名和密码登录 然后才能重定向到我想使用 jsoup 刮除数据的页面 由于 jsoup 线程将是不同的会话 因此用户必须再次登录 现在我想使用从 webview 接收
Android
cookies
WebView
Jsoup
scrape
如何将本地 html 文件加载到 Jsoup 中?
我似乎无法使用 Jsoup 库加载本地 html 文件 或者至少它似乎没有意识到这一点 我在本地文件中硬编码了确切的 html 作为 var html 当我切换到该文件而不是文件输入时 代码完美运行 但两次都会读取该文件 import ja
Java
html
Jsoup
Jsoup POST:定义返回 HTML 的选定选项?
我正在尝试生成一个 HTML 帖子到一个包含选项列表的页面 有一个下拉列表 用户可以在其中选择一个项目 然后单击生成按钮 根据所选的选项 它会返回不同的结果 我对前后的 HTML 进行了比较 可以看到差异如下 Before
Java
Android
html
Jsoup
Jsoup div[class=] 语法有效,而 div.class 语法无效 - 为什么?
对于以下 HTML 片段 div class class one class two class three classfour classfive classsix some inner content div 以下 Jsoup 选择器w
Java
htmlparsing
Jsoup
使用 JSOUP 登录 ConEd 网站
我已经广泛阅读了有关如何做到这一点的内容 并且尝试了许多不同的变体 但我无法让它发挥作用 基本上 我只想登录 ConEdison 网站并抓取我的账单历史记录 这是我所拥有的 Connection Response loginForm Jso
Java
authentication
Jsoup
screenscraping
JSOUP HTML 解析器
有没有办法得到起始行号和列号 and 结束行号和列号元素 标签 我正在创建 HTML 编辑器 需要突出显示标签以根据给定的某些场景进行速度优化起始和结束行号和列号 不 不幸的是 目前 jsoup 无法做到这一点 目前 Jsoup 不跟踪行号
Java
html
htmlparsing
Jsoup
JSOUP - 如何使用 JSOUP 抓取“需要登录”页面
我在抓取我想要抓取的确定的网站时遇到困难 问题是 成功登录该网站后 我无法访问需要有效登录的链接 例如 public Document executeLogin String user String password try Connect
Java
Session
cookies
webcrawler
Jsoup
«
1
2
3
4
5
6
7
»