• 正则表达式 又称规则表达式 英语 Regular Expression 在代码中常简写为regex regexp或RE 计算机科学的一个概念 正则表通常被用来检索 替换那些符合某个模式 规则 的文本 大家在写正则表达式的过程中 可利用开源中
  • PyQuery库也是一个非常强大又灵活的网页解析库 如果你有前端开发经验的 都应该接触过jQuery 那么PyQuery就是你非常绝佳的选择 PyQuery 是 Python 仿照 jQuery 的严格实现 语法与 jQuery 几乎完全相
  • 在编写爬虫进行网页数据的时候 大多数情况下 需要在请求是增加请求头 下面介绍一个python下非常好用的伪装请求头的库 fake useragent 具体使用说明如下 安装fake useragent库 pip install fake u