我正在研究爬虫,它将在电子商店中搜索商品。这是我的论文,所以没有任何商业意义。
我使用 Java SE。
我将需要某种高级库,以进行一些诊断测试(如果该网页是我正在寻找的内容),并从正确的网页中提取相关数据。
您是否有使用解析器库的个人经验可以向我推荐最好的一个?
JSoup http://jsoup.org/太棒了。强烈推荐。