基于python的股票客户流失数据分析模型

2023-11-02

目录
1.案例背景 2
2. 读取数据 2
3. 划分特征变量和目标变量 3
4. 模型的搭建和使用 3
5. 模型的使用 4
6. ROC曲线对模型的评估 7
7.总结 10
8.参考文献 10
9.致谢 10

1.案例背景
在进行一笔股票交易时候,交易者(股民)都要给其账户所在的证券公司支付一些手续费,虽然单笔手续费不是很高,但是股票市场的每日都有巨额的成交量,每一笔交易的手续费汇总起来,数量相当可观,这部分收入对于一个证券公司来说非常重要的,甚至有时候可以占到营业总收入的50%以上,因此,证券公司对于客户(交易者)的忠诚和活跃度是很看重的。
如果一个客户不再通过某个证券公司交易,即该客户流失了,那么证券公司便损失一个收入来源,因此,证券公司搭建一套客户流失预警模型来预测客户是否流失,并对流失概率较大的客户采集相应的挽回措施,因为通常情况下,获得新客户成本比保留现有客户成本要高得多。
2.读取数据
代码:
import pandas as pd
df = pd.read_excel(r"D://Python//股票客户流失.xlsx")
df.head()
数据读取结果展示:
在这里插入图片描述

3.划分特征变量和目标变量
通过下列代码将特征变量和目标变量单独提取出来,为以后数据分析做准备。
代码:
x = df.drop(columns = ‘是否流失’)
y = df[‘是否流失’]
4.模型的搭建和使用
(1)划分训练集和测试集
进行模型的创建和使用之前都会将数据集划分为训练集数据和测试集数据,简称训练集和测试集。顾名思义,训练集用来训练数据和搭建模型,测试集则用来检验训练后的所搭建的模型的效果,划分训练集和测试集的目的是为了模型进行评估,二是通过测试集对模型进行调优。将数据划分为训练集和测试集的代码如下:

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

基于python的股票客户流失数据分析模型 的相关文章

  • Ubuntu下deb包的安装方法

    deb是debian linus的安装格式 跟red hat的rpm非常相似 最基本的安装命令是 dpkg i file deb dpkg 是Debian Package的简写 是为Debian 专门开发的套件管理系统 方便软件的安装 更新
  • conda init 关闭和重启shell_通过命令行重启Ubuntu的3种方法

    大多数Linux用户 特别是管理员 非常依赖命令行来在Ubuntu上执行频繁的任务 其中一个任务就是重新引导 重新启动系统 出于各种原因 我们倾向于重启系统 其中一个原因是 有些软件需要在安装结束时重新启动 才能够完全运行 Ubuntu上的
  • 预训练模型 & Fine-tuning

    https blog csdn net weixin 42137700 article details 82107208 https zhuanlan zhihu com p 46833276 在实践中 由于数据集不够大 很少有人从头开始训

随机推荐