我想编写一个 OCaml 函数,它接受一个 URL 并返回一个由该位置的 HTML 文件内容组成的字符串。有任何想法吗?
多谢!
最好的,
苏里卡托。
我已经使用 ocurl 和 nethtml 完成了这两件事
ocurl http://sourceforge.net/projects/ocurl/读取 URL 的内容(这里有大量属性;这是最少的),
let string_of_uri uri =
try let connection = Curl.init () and write_buff = Buffer.create 1763 in
Curl.set_writefunction connection
(fun x -> Buffer.add_string write_buff x; String.length x);
Curl.set_url connection uri;
Curl.perform connection;
Curl.global_cleanup ();
Buffer.contents write_buff;
with _ -> raise (IO_ERROR uri)
和来自nethtml http://ocamlnet.sourceforge.net/; (您可能需要设置 DTDNethtml.parse
)
let parse_html_string uri =
let ch = new Netchannels.input_string (string_of_uri uri) in
let docs = Nethtml.parse ?return_pis:(Some false) ch in
ch # close_in ();
docs
Cheers!
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)