我正在通过 PHP 从网页中获取一些信息simple_php_dom
和卷曲。问题是页面构建不正确,因此 DOM 对象包含错误信息。
如何获取 HTML 文件作为 PHP var 中的字符串,以便我可以通过它运行正则表达式?
Curl 不起作用,因为它忽略了不好的部分。
simple_html_dom.php
有同样的问题。
wget
不起作用,因为我在服务器上没有它的权限。
文件获取内容 http://www.php.net/file_get_contents— 将整个文件读入字符串
string file_get_contents (
string $filename [, int $flags= 0 [, resource $context [, int $offset= -1 [, int $maxlen= -1 ]]]]
)
从手册:
此函数与 file() 类似,不同之处在于 file_get_contents() 以字符串形式返回文件,从指定的偏移量开始最多 maxlen 字节。失败时,file_get_contents() 将返回 FALSE。
file_get_contents() 是将文件内容读入字符串的首选方法。如果您的操作系统支持,它将使用内存映射技术来提高性能。
它适用于网页和文件。您只需使用“即可获取 HTML”http://whatever.com/page.html http://whatever.com/page.html“作为$文件名。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)