Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
使用 DOM 解析 HTML 时保留文件偏移量?
我要修改 img src 格式不太畸形的 HTML 中的属性 WordPress 帖子 我知道我可以采取简单的方法并使用正则表达式 但我担心穿着蓝色毛茸茸的衣服的人会在我睡梦中困扰我 https meta stackexchange com
php
DOM
htmlparsing
将 HTML 表解析为 CSV 的最佳方法
我必须从现有网站上获取一些产品数据并将其放入数据库中 数据全部采用 HTML 表格格式 型号是唯一的 但每个产品可以有任意数量的不同属性 因此我需要解析的表格都有不同的列和标题 table tr td Model No td td Weig
c
htmlparsing
解析 HTML:成人分类系统
我正在研究网络上使用的不同且 有时已过时 的评级 分类标准 IE PICS http www w3 org PICS POWDER http www w3 org 2007 powder ICRA http www fosi org icr
c
htmlparsing
Classification
powder
美丽的汤和表抓取 - lxml 与 html 解析器
我正在尝试使用 BeautifulSoup 从网页中提取表格的 HTML 代码 table class facts label table 我想知道为什么下面的代码适用于 html parser 并打印回来none如果我改变 html pa
python
webscraping
htmlparsing
beautifulsoup
lxml
BeautifulSoup HTML 获取 src 链接
我正在使用 python 3 5 1 和 requests 模块制作一个小型网络爬虫 该模块从特定网站下载所有漫画 我正在尝试一个页面 我使用 BeautifulSoup4 解析页面 如下所示 import webbrowser impor
python
html
python3x
beautifulsoup
htmlparsing
为什么 BeautifulSoup .children 包含无名元素以及预期标签
Code usr bin env python3 from bs4 import BeautifulSoup test table tbody tr td div b Icon b div td tr tbody table soup Be
python
htmlparsing
beautifulsoup
html 标签内的正则表达式
我想从以下 HTML 片段中解析高清价格 我只有 html 代码的片段 所以我不能为此使用 HTML 解析器 div span View In iTunes span span class price 19 99 span ul class
python
html
regex
htmlparsing
用 C# 与网页交互
有一个使用 ColdFusion 创建的网站 不确定这是否重要 我需要与该网站进行交互 我需要做的主要事情是导航到不同的页面并单击按钮 关于如何做到这一点 我提出了两个想法 第一种是使用WebBrowser 控件 有了这个 我当然可以导航页
c
Automation
screenscraping
htmlparsing
简单的html dom:如何获取没有特定属性的标签
我想获取 class 属性等于 someclass 的标签 但仅获取那些未定义属性 id 的标签 I tried以下 基于此答案 但不起作用 html gt find someclass id Note 我在用着简单的 HTML DOM 类
php
Parsing
cssselectors
htmlparsing
simplehtmldom
如何使用 dom php 解析器
我是 PHP 中 DOM 解析的新手 我有一个正在尝试解析的 HTML 文件 它有一堆这样的 DIV div div class txtnormal div Content1 div div Content2 div div div div
php
DOM
htmlparsing
如何使用JAVA从html页面获取表格
我正在开发一个项目 尝试从互联网获取财务报表并在 JAVA 应用程序中使用它们来自动创建比率和图表 我正在使用的网站使用登录名和密码才能进入牌桌 标签是 TBODY 但 html 中还有另外 2 个 TBODY 如何使用 java 将表打印
Java
Arrays
Jsoup
htmlparsing
MSHTML:CreateDocumentFromString 而不是 CreateDocumentFromUrl
我想使用 MSHTML 库来解析字符串变量中的一些 HTML 但是 我不知道该怎么做 我可以轻松解析给定已知 URL 的网页内容 但不能直接解析源 HTML 这可能吗 如果是这样 怎么办 Public Sub ParseHTML sHTML
vba
VB6
htmlparsing
mshtml
使用 HTML Agility Pack 替换 HTML div InnerText 标记
我正在使用 HTML Agility Pack 来操作和编辑 HTML 文档 我想更改该字段中的文本 如下所示 div b Some text here b br div 我希望将此 div 中的文本更新为 div b Some other
c
aspnet
htmlparsing
htmlagilitypack
D 有 HTML 解析吗?
我正在寻找 D 语言的 HTML 解析 如果可能的话 支持 XPath 我做了一些谷歌搜索 但没有运气 很难找到带有 D 关键字的解决方案 就像C 我说 C 谷歌说C On http www dsource org http www dso
htmlparsing
d
使用 Perl 解析 HTML 页面的正则表达式链接 [重复]
这个问题在这里已经有答案了 可能的重复 如何使用 Perl 从 HTML 中删除外部链接 https stackoverflow com questions 1598053 how can i remove external links f
html
regex
perl
Parsing
htmlparsing
在 R 中列出 HTTP/FTP 服务器上的文件
我正在尝试从 R 获取 HTTP FTP 服务器上的文件列表 以便在下一步中我将能够下载它们 或选择一些符合我的下载标准的文件 我知道可以在网络浏览器 下载管理器 中使用外部程序 这将允许我选择要从当前网页 FTP 下载的文件 但是 我希望
regex
r
htmlparsing
textparsing
BeautifulSoup 获取列表的 href - 需要简化脚本 - 替换多处理
我有以下汤 下一个 我想从中提取 href some url 我想提取 href some url 以及此页面上列出的页面的完整列表 https www catholic hierarchy org diocese laa html htt
python
webscraping
beautifulsoup
htmlparsing
Python HTMLParser:UnicodeDecodeError
我正在使用 HTMLParser 来解析我用 urllib 下拉的页面 并且遇到了UnicodeDecodeError将某些传递给时的异常HTMLParser 我尝试使用chardet检测编码并转换为ascii or utf 8 the d
python
characterencoding
htmlparsing
PHP 中的 DOM 文档
我刚刚开始阅读有关 DOM 的文档和示例 以便抓取和解析文档 例如 我的部分文档如下所示 div table tr td Crap td tr tr td width 172 valign top a href link img heigh
php
xmlparsing
htmlparsing
domdocument
如何从 Java 验证 HTML?
从 Java 验证 HTML 的快速而简单的方法是什么 我正在寻找一个开源 PD 类 或一组类 来描述 100 多个 HTML 标签的各种属性 例如 标签是可选的吗 空的 省略其结束标签是否合法 该标签还可以包含哪些其他标签 如果有 哪些属
Java
html
validation
htmlparsing
«
1
2
3
4
5
6
7
...10
»