毕业设计：Python招聘数据采集分析可视化系统（爬虫+机器学习预测算法） Flask框架薪资预测（源码+文档）

2023-12-05

博主介绍：✌全网粉丝10W+,前互联网大厂软件研发、集结硕博英豪成立工作室。专注于计算机相关专业毕业设计项目实战6年之久，选择我们就是选择放心、选择安心毕业✌

毕业设计：2023-2024年计算机专业毕业设计选题汇总（建议收藏）

毕业设计：2023-2024年最新最全计算机专业毕设选题推荐汇总

1、项目介绍

Python、Flask框架、MySQL数据库、selenium爬虫框架
预测模型：model_final.py 线性回归模型
采集：猎聘网

2、项目界面

0、地区分析

在这里插入图片描述

1、学历分析可视化

在这里插入图片描述

2、薪资分析可视化
在这里插入图片描述

3、首页数据管理

在这里插入图片描述

4、机器学习薪资预测
在这里插入图片描述

5、注册登录

在这里插入图片描述

6、爬虫数据采集

在这里插入图片描述

3、项目说明

如今时代，人们获取信息的方式已经从传统媒体如电视、报纸、书籍、信件等转变为以互联网为主要来源，这促进了信息的快速更新和获取，与此同时，计算机的存储能力和复杂算法的飞速发展，导致数据量在近年是指数级增长，导致各行各业的决策越来越依赖于数据，从“业务驱动”向“数据驱动”转变。因此，我们需要充分利用大数据的海量处理和智能分析能力，准确抓取时代的热点数据，并在此基础上构建高效率的分析系统。
本论文旨在通过使用Python的requests库爬取拉勾网的招聘数据，并对数据进行清洗和持久化保存，以研究市场上招聘信息的趋势和分布情况。使用Flask框架作为后端技术，将数据库中的数据呈现给前端展示，借助基于前端框架Layui的应用，并结合图表展示工具ECharts，将数据以饼图、条形图等形式进行可视化展示。主要展示了招聘信息的数量分布、薪资分布情况以及关键词的分布情况。通过数据分析和可视化展示，得出如下结论：不同城市和行业的招聘信息数量和薪资水平有明显差异，而不同的招聘职位则有不同的职能和技能要求。因此，这些数据和分析结果对于个人求职者和企业招聘者提供了有益的参考。

4、部分代码

from flask import Flask, render_template, request, redirect, session
from utils import query
from utils.getDataHandle import getCityHandle, getIndustry
from utils.getIndexNum import indexNum
from utils.getTotalJob import *
from utils.getEducation import getEducationNum
from utils.getSalaryNum import getSalaryNum
from utils.getExp import getExpNum
from utils.getCity import getCityNum
import pandas as pd
import model_final
import model_test_final
app = Flask(__name__)
app.secret_key = 'this is session_key!'
app.config['SESSION_COOKIE_NAME'] = "session_key"


@app.route('/home', methods=['GET', 'POST'])
def home():
    email = session.get('email')
    total_job = getTotalJob()
    companyNum, jobNum, cityNum, industryNum = indexNum()
    # print(total_job)
    return render_template('index.html', email=email, total_job=total_job, companyNum=companyNum, jobNum=jobNum,
                           cityNum=cityNum, industryNum=industryNum)


@app.route('/data_education', methods=['GET', 'POST'])
def data_education():
    email = session.get('email')
    education = getEducationNum()
    return render_template('data_education.html', email=email, education=education)


@app.route('/data_city', methods=['GET', 'POST'])
def data_city():
    email = session.get('email')
    city = getCityNum()
    return render_template('data_city.html', email=email, city=city)


@app.route('/data_salary', methods=['GET', 'POST'])
def data_salary():
    email = session.get('email')
    row, column = getSalaryNum()
    return render_template('data_salary.html', email=email, row=row, column=column)


@app.route('/data_experience', methods=['GET', 'POST'])
def data_experience():
    email = session.get('email')
    row, column = getExpNum()
    return render_template('data_experience.html', email=email, row=row, column=column)


@app.route('/data_salary_dplearn', methods=['GET', 'POST'])
def data_salary_dplearn():
    email = session.get('email')
    salary = 0
    if request.method == "GET":
        return render_template('data_salary_dplearn.html', email=email, salary=salary)
    else:
        input_data=dict(request.form)
        job_title=input_data['job_title']
        input_data_new = {key: [value] for key, value in input_data.items()}
        print(input_data_new)  # {'job_title': ['python开发工程师'], 'city': ['北京'], 'pre': ['本科']}
        input_df = pd.DataFrame(input_data_new)

        input_encoded = pd.get_dummies(input_df, columns=['job_title', 'city','education'])

        input_encoded = input_encoded.reindex(columns=model_final.X_encoded.columns, fill_value=0)

        salary = model_test_final.predict_salary(input_encoded)
        return render_template('data_salary_dplearn.html',salary=salary,job_title=job_title)


@app.route('/data_search', methods=['GET', 'POST'])
def data_search():
    email = session.get('email')
    data_info = dict(request.form)
    total_job = getTotalJob()
    if request.method == 'GET':
        return render_template('data_search.html', email=email, total_job=total_job)
    else:
        if data_info.get('city') != '':
            city_data = data_info['city']
            total_job = getCityHandle(city_data)
            return render_template('data_search.html', email=email, total_job=total_job)
        elif data_info.get('company_type') != '':
            industry_data = data_info['company_type']
            total_job = getIndustry(industry_data)
            return render_template('data_search.html', email=email, total_job=total_job)


@app.route('/register', methods=['GET', 'POST'])
def register():
    if request.method == 'GET':
        return render_template('register.html')
    elif request.method == 'POST':
        request.form = dict(request.form)
        if request.form['password'] != request.form['checkpassword']:
            return render_template('error.html', message='两次密码不一致!请重新注册')
            # return '两次密码不一致'

        def filter_fn(item):
            return request.form['email'] in item  # 检测email是否已存在

        users = query.querys('select * from data_user', [], 'select')
        filter_list = list(filter(filter_fn, users))  # filter()过滤函数序列 第一个参数是函数 第二个是序列
        if len(filter_list):  # 如果长度不为0，说明在数据库里找到了，说明已存在
            return render_template('error.html', message='该用户已被注册')
        else:
            query.querys('insert into data_user(email,password,address) values (%s,%s,%s)',
                         [request.form['email'], request.form['password'], request.form['address']], 'no_select')
            return redirect('/login')


@app.route('/', methods=['GET', 'POST'])
def login():
    if request.method == 'GET':
        return render_template('login.html')
    elif request.method == 'POST':
        request.form = dict(request.form)

        # 过滤函数
        def filter_fn(item):
            return request.form['email'] in item and request.form['password'] in item

        users = query.querys('select * from data_user', [], 'select')
        filter_user = list(filter(filter_fn, users))
        if len(filter_user):  # 检测库中是否有账户
            session['email'] = request.form['email']
            return redirect('/home')
        else:
            return render_template('error.html', message='用户邮箱或密码错误')


@app.route('/loginOut')
def loginOut():
    session.clear()
    return redirect('/login')


if __name__ == '__main__':
    app.run(debug=True)

????✌ 感兴趣的可以先收藏起来，点赞关注不迷路，想学习更多项目可以查看主页，大家在毕设选题，项目代码以及论文编写等相关问题都可以给我留言咨询，希望可以帮助同学们顺利毕业！ ????✌

源码获取：

???? 由于篇幅限制，获取完整文章或源码、代做项目的，拉到文章底部即可看到个人联系方式。 ????

点赞、收藏、关注，不迷路， 下方查看 ???????? 获取联系方式 ????????

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)