我有一个有效的 Bash 脚本来提取标题标签。我需要 AWK 字段分隔符的帮助来从 HTML 中提取元标记,如下所示:
<meta name="keywords" content="key1, key2, key3">
我的脚本可以提取标题,但是meta name
不起作用。
#!/bin/bash
for LINE in `cat htmls.txt`
do
echo $LINE
awk 'BEGIN{IGNORECASE=1;FS="<title>|</title>";RS=EOF} {print $2}' $LINE |
awk '{ if (NF > 0) printf("%s\n", $0); }'
done
我想我需要一个正则表达式解决方案。有任何想法吗?
第一次安装xml2 http://www.ofb.net/~egnor/xml2/ e.g.
sudo apt-get install xml2
wget -q -O - http://www.latin.fm | xml2 | grep meta | awk -F/ '{print $NF}'
Output
@property=og:title
@content=Latin FM
...
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)