R 有没有办法转换 HTML 字符实体编码?
我想转换 HTML 字符实体,例如&
to &
or
>
to >
对于 Perl 来说,存在 HTML::Entities 包可以做到这一点,但我在 R 中找不到类似的东西。
我也尝试过iconv()
但未能得到满意的结果。也许还有一种方法使用XML
包,但我还没弄清楚。
使用 Unescape xml/html 值xml2
包裹:
unescape_xml <- function(str){
xml2::xml_text(xml2::read_xml(paste0("<x>", str, "</x>")))
}
unescape_html <- function(str){
xml2::xml_text(xml2::read_html(paste0("<x>", str, "</x>")))
}
例子:
unescape_xml("3 < x & x > 9")
# [1] "3 < x & x > 9"
unescape_html("€ 2.99")
# [1] "€ 2.99"
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)