Python爬取招聘信息,并且存储到MySQL数据库中

2023-11-03

  前面一篇文章主要讲述,如何通过Python爬取招聘信息,且爬取的日期为前一天的,同时将爬取的内容保存到数据库中;这篇文章主要讲述如何将python文件压缩成exe可执行文件,供后面的操作。
  
  这系列文章主要是最近研究了数据库的定时计划备份,联系爬虫简单做的一个实验,但方法可以,尤其在Windows xp年代。整个系列主要分为五部分,共五篇文章:
  
  1.Python爬取招聘信息,并且存储到MySQL数据库中;
  
  2.调用pyinstaller包将py文件打包成exe可执行文件;
  
  3.设置Windows系统的计划,制作定时任务,每天早上定时执行exe爬虫;
  
  4.结合PHP(因毕业设计指导学生的是PHP系统)简单实现前端招聘信息界面;
  
  5.补充知识:Python调用短信猫发送招聘短信到客户手机。
  
  文章比较基础,希望对您有所帮助,如果文章中存在错误或不足之处。
  
  一. 安装pyinstaller
  
  Py文件通常需要运行在Python编程坏境中,而可执行exe文件更方便,尤其是我们第三篇文章制作定时任务 时,执行exe文件更加方便。
  
  而python将py文件打包成exe可执行文件的方法通常包括两个:pyInstaller和py2exe。这篇文章主要是讲述如何安装pyinstaller包及其打包操作。
  
  你可以再Github中下载进行安装,参考下面"哈士奇说喵"的文章。
  
  下载地址:https://github.com/pyinstaller/pyinstaller/
  
  这篇文章主要介绍pip进行安装的方法,步骤如下:
  
  1.打开cmd,然后去到Python的Scripts文件夹下,如下图所示。
  
  输入安装命令:pip install pyinstaller
  
  2.安装过程如下图所示,调用pip指令安装会进行自动下载及匹配。
  
  3.安装成功后,会在Python/Scripts文件夹下显示该包。
  
  参考文章:关于python打包成exe的一点经验之谈 - ChenJian
  
  将自己的python程序打包成exe - 哈士奇说喵
  
  [Python] 项目打包:5步将py www.sb45475.com 文件打包exe文件 - ccccshq
  
  二. 简单实现exe打包
  
  安装成功pyinstaller扩展包后,需要对文件进行打包操作 。
  
  假设存在一个test01.py文件,功能是打开百度网页,代码如下:
  
  [python] view plain copy
  
  from selenium import webdriver
  
  from selenium.webdriver.common.keys import Keys
  
  import time
  
  driver = webdriver.Firefox()
  
  driver.get("http://www.baidu.com/")
  
  我们将该test01.py文件放到Python安装路径的Scripts下,我的路径如下:
  
  C:\Software\Program Software\Python\Scripts
  
  注意Scripts放置Python的各种第三方扩展包,这里的pyinstaller.exe在此处。
  
  现在需要打包exe程序,步骤:
  
  1.在cmd环境进入该Scripts文件夹路径下;
  
  2.输入指令打包:pyinstaller www.xuancai88c.cn/ - F test01.py
  
  之后你的命令窗(黑框)会运行该代码,并进行打包,运行过程如下图所示。
  
  打包好会在Scripts路径下生成两个文件夹:dist和build,如下图所示。
  
  然后,可执行exe文件在dist文件夹下,如下图所示。
  
  双击该test01.exe,会自动弹出Firefox浏览器,然后访问百度。
  
  更多参数如下图所示:
  
  三. 定时爬虫打包exe文件
  
  下面用同样的方法打包前一篇文章写的定时爬虫代码。步骤如下:
  
  1.将test_zl.py (智联)文件放置Scripts文件夹,与pyinstaller.exe一起。
  
  2.打开cmd,去到Scripts文件夹下。
  
  执行命令: pyinstaller -F test_zl.py
  
  3.生成文件在当前目录下,包括b http://www.wmyl88.com uild和dist文件夹。
  
  4.执行test_zl.exe文件,运行如下图所示。
  
  5.同时数据库如下,可以看到4月23日的招聘信息被爬取成功。
  
  后面还将继续探寻、继续写文,写完这种单击版的定时发送功能,后面研究Python服务器的相关功能。
  
  风雪交加雨婆娑,
  
  琴瑟和鸣泪斑驳。
  
  披星戴月辗转梦,
  
  娜璋白首爱连绵。
  
  最后希望文章对你有所帮助,如果文章中存在错误或不足之处,还请海涵~

转载于:https://www.cnblogs.com/chenergougou/p/7149632.html

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Python爬取招聘信息,并且存储到MySQL数据库中 的相关文章

随机推荐

  • 计算机网络之Token、JWT

    文章目录 计算机网络之Token JWT 1 登录验证的方式 2 token定义 3 taken刷新 4 JWT跨域认证 5 JWT跨域认证起源 6 JWT原理 7 JWT的数据结构 7 1介绍 7 2Header 7 3Playload
  • 14.大数据学习之旅——HBASE表设计&HBase优化

    HBASE表设计 Rowkey设计 Rowkey是不可分割的字节数 按字典排序由低到高存储在表中 在设计HBase表时 Rowkey设计是最重要的事情 应该基于预期的访问模式来为Rowkey建 模 Rowkey决定了访问HBase表时可以得
  • Nginx的负载均衡 - 整体架构

    Nginx版本 1 9 1 我的博客 http blog csdn net zhangskd 什么是负载均衡 我们知道单台服务器的性能是有上限的 当流量很大时 就需要使用多台服务器来共同提供服务 这就是所谓的集群 负载均衡服务器 就是用来把
  • mysql属于dql语句的是_mysql学习日记——DQL语句

    DQL 查询语句 select字段列表from表名列表where条件列表group by分组字段having分组之后的条件order by排序 limit 分页限定 基础查询 1 多个字段的查询 select 字段名1 字段名2 from
  • Visual Studio 2015 的安装和使用

    VS2015 是现在微软公司最新也是最强大的IDE 可以开发C C VB Android iOS等多种语言和平台的应用程序 而且 对应的免费版本VS2015 社区版 也出来了 如果只是为了初学或者是想尝试一下VS的同学 可以下载VS2015
  • 网络工程师干货:华为设备故障管理命令大全

    alarm 系统视图 命令功能 alarm命令用来进入告警管理视图 命令格式 alarm 使用实例 进入告警管理视图
  • selenium处理网页下拉加载数据爬取并存入excel

    前言 之前有个同学询问我是否能够爬取知乎的全部回答 当初只会Scrapy无法实现下拉的数据全部加载 后来在意外中接触了selenium的自动化测试 看出了selenium的模拟能力的强大 而昨天有个同学问我能否爬取中国工商银行远程银行的精彩
  • 编译ROS PCL工程时出现找不到包的问题

    编译PCL工程时 如果出现类似这样的问题 Add the installation prefix of visualization to CMAKE PREFIX PATH or set 则意味着编译器找不到相关包 则我们可以通过添加 fi
  • 基于qt的人脸识别

    文章目录 前言 一 Ubuntu中运行效果 二 代码部分 1 工程结构 2 camera代码 移植到linux板子上面的思路 前言 提示 这里可以添加本文要记录的大概内容 今天准备用qt做一个人脸识别功能 同时看能不能移植到板子上面 提示
  • 电子电路技术基础之频率响应

    电子电路技术基础之放大电路的频率响应 文章目录 电子电路技术基础之放大电路的频率响应 前言 一 频率响应概述 基本概念 二 波特图 总结 前言 郑老师模电课听课笔记 23 一 频率响应概述 基本概念 高通电路 传输特性 下限截止频率 最大值
  • 如何理解Adam算法(Adaptive moment estimation)?

    作者 薰风初入弦 链接 https www zhihu com question 323747423 answer 790457991 来源 知乎 著作权归作者所有 商业转载请联系作者获得授权 非商业转载请注明出处 文章和论文看不懂 通常有
  • QT问题解决: multiple definition of XXX

    参考这个链接的https blog csdn net liyuefeilong article details 44071053方法处理后 问题还是存在 打开 pro文件 SOURCES 下发现某个Cpp文件重复了 这个是添加已存在文件时I
  • 剪贴板在当前服务器不可映射,关于rdpclip.exe进程问题 导致远程桌面剪贴板无法使用的问题...

    我们来讨论下你这句话 由于网络波动造成的不稳定 导致进行文件传输时进程中断 再次传输时则不能进行文件传输 再次传输时则不能进行文件传输 这个的意思就是网络原因导致某次文件传输失败后 整个服务就不能用了吗 我理解rdpclip exe这个服务
  • UE4 低配优化

    总结一下UE4的低配优化 1 比较快的方式 修改引擎可扩展设置 关于Scalability Setting的详细说明 https docs unrealengine com en us Engine Performance Scalabil
  • 机器学习sklearn-多项式回归

    目录 线性关系 线性模型和非线性模型 利用线性回归解决非线性问题 多项式回归 线性模型 线性关系 首先 线性 这个词用于描述不同事物时有着不同的含义 我们最常使用的线性是指 变量之间的线性关系 linear relationship 它表示
  • DirectShow对avi视频按帧设置慢放功能

    转载请标明是引用于 http blog csdn net chenyujing1234 欢迎大家提出意见 一起讨论 DirectShow对avi视频按帧设置慢放功能需要视频源支持帧操作 可以通过IMediaSeeking IsFormatS
  • 参加蓝桥杯的经历

    蓝桥杯 我参加蓝桥杯是一个巧合 我是专科生 额 过往经历就不说了 反正就是以前没好好学习然后就去专科读书了 不过也不怎么后悔 高考完成绩出来 那时候我都有点想去新东方的来着 我一个发小的姐姐学的计算机 然后工资蛮高 他家准备让他学计算机 然
  • Odd Even Linked List

    Given a singly linked list group all odd nodes together followed by the even nodes Please note here we are talking about
  • 排序算法比较图表

    一目了然
  • Python爬取招聘信息,并且存储到MySQL数据库中

    前面一篇文章主要讲述 如何通过Python爬取招聘信息 且爬取的日期为前一天的 同时将爬取的内容保存到数据库中 这篇文章主要讲述如何将python文件压缩成exe可执行文件 供后面的操作 这系列文章主要是最近研究了数据库的定时计划备份 联系