基于python技术的电商母婴购物数据分析

2023-10-27

人生苦短 我用python

Python其他实用资料:点击此处跳转文末名片获取

在这里插入图片描述

一、数据集概述

​ 今天我们来看一个来着阿里云天池的数据集:淘宝母婴购物数据,有两个csv文件:

mum_baby.csv

mum_baby_trade_history.csv

1、mum_baby.csv

它包含了953个孩子的生日和性别信息,这些信息是由淘宝或天猫的消费者提供的。

在这里插入图片描述

2、mum_baby_trade_history.csv

该表包含29971条淘宝用户的历史交易信息。

在这里插入图片描述

3、分析方向

1.什么商品类别销量最佳?

2.用户为之购买商品的婴儿年龄、性别分布?

3.销量与月份关系?

4.用户复购情况?

在这在这里插入图片描述
里插入图片描述

二、数据预处理

以时间段较长的奶粉为例.

对配方奶粉的分段,
主要是根据国际食品法典委员会制定的cac来进行划分。

婴幼儿奶粉现在大范围上基本分为一段、二段、三段,
部分婴幼儿奶粉可能会分为四段、五段。

奶粉分段及适用年龄:

第1段婴幼儿奶粉适合0~6个月的宝宝;

第2段婴幼儿奶粉适合6~12个月的宝宝;

第3段婴幼儿奶粉适合1周岁~3周岁的宝宝;

第4段奶粉适合3周岁~7周岁的孩子。

7周岁最多为365*7=2555天,
那么对于天数大于2560天的天数视为无效数据,
删除行。

import pandas as pd

mum_baby = pd.read_csv('.\data\mum_baby.csv')
trade_history = pd.read_csv('.\data\mum_baby_trade_history.csv')


tample = mum_baby.merge(trade_history, how="left", on='user_id').fillna(0)

tample['birthday'] = pd.to_datetime(tample['birthday'].astype(str))
tample['day'] = pd.to_datetime(tample['day'].astype(str))
age_days = tample['day'] - tample['birthday'] 
tample.loc[:, 'age_days'] = age_days  
print(tample.age_days)

j = 0
for i in age_days:
    tample.loc[j, 'age_days'] = i.days
   
    j += 1

tample.age_days = pd.DataFrame(tample.age_days, dtype=int)


tample[tample['age_days'] > 2560].sort_values('age_days').to_excel(r'.\data\age_days_gt7year.xlsx')
tample[tample['age_days'] < 0].sort_values('age_days').to_excel(
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

基于python技术的电商母婴购物数据分析 的相关文章

随机推荐

  • 实现SSM简易商城项目的商品查询功能

    实现SSM简易商城项目的商品查询功能 介绍 在SSM Spring SpringMVC MyBatis 框架下 我们可以轻松地实现一个简易商城项目 本博客将重点介绍如何实现商品查询功能 帮助读者了解并掌握该功能的开发过程 步骤 1 创建数据
  • LeetCode-1306. Jump Game III

    Given an array of non negative integers arr you are initially positioned at start index of the array When you are at ind
  • 用Flask和Vue制作一个单页应用(自己学习)

    这里以一个简单的例子 展示如何把前端页面的增删改查请求 传递到后端进行数据的操作 一 https zhuanlan zhihu com p 311323583 二 https zhuanlan zhihu com p 311510196 三
  • 王者荣耀s15服务器维护,王者荣耀s15赛季更新全部内容

    原标题 王者荣耀s15赛季更新全部内容 王者荣耀S14很快就要结束了 体验服的版本更新也已经放出来进行测试了 大家都对新赛季的改动非常期待 究竟会有哪些英雄成为新的版本之子 哪些英雄会沦为下水道呢 以下均为体验服内容 不代表最终版本数据 p
  • 栈和队列 Stack and Queue

    Stack and Queue Stack and Queue Linked List Implementation ListNode Stack Queue Array Implementation Stack Queue Stack a
  • 又一巨头宣布入局AIGC,一口气开源数个模型,还道出了它的变现之道

    金磊 发自 凹非寺量子位 公众号 QbitAI AIGC AI生成内容 这个概念在今年可以说是火得一塌糊涂 例如Stable Diffusion 只要对它说一句话 唰唰唰 地就能秒生成画作 再如最近大火的ChatGPT 对答如流堪比人类 简
  • 学习day59

    昨天学了插槽 但是没有即笔记了 今天的是vuex 总体来说 vuex就是一个共享单车 每个人都可以使用他 也可也对他进行反馈 即把一个数据列为vuex 然后每个组件可以使用这个对象 也可也反过来反馈他 这一个设计是将A组件的一个数据作为公共
  • git报错

    Git报错总结 一 git remote add origin git code aliyun com account TestProject git发生报错 报错信息如下 error remote origin already exist
  • 输入三个字符串,要求找出其中的最大者

    解题思路 设一个二维的字符数组 大小为3 20 每一行存放一个字符串 字符串比较用strcmp 字符串复制用strcpy include
  • Shell脚本编程教程

    1 Shell脚本语言的基本结构 1 1 Shell脚本的用途 自动化常用命令 执行系统管理和故障排除 创建简单的应用程序 处理文本或文件 1 2 Shell脚本基本结构 Shell脚本编程 是基于过程式 解释执行的语言 编程语言的基本结构
  • jquery获取select选中的值

    误区 一直以为jquery获取select中option被选中的文本值 是这样写的 s text 获取所有option的文本值 实际上应该这样 s option selected text 获取选中的option的文本值 获取select中
  • 花费7元训练自己的GPT 2模型

    在上一篇博客中 我介绍了用Tensorflow来重现GPT 1的模型和训练的过程 这次我打算用Pytorch来重现GPT 2的模型并从头进行训练 GPT 2的模型相比GPT 1的改进并不多 主要在以下方面 1 GPT 2把layer nor
  • hexo设置博客的主题

    文章目录 一 设置博客的主题 二 设置博客的动态背景 一 设置博客的主题 1 登录 https hexo io themes 2 选择自己喜欢的个人主题 然后点击对应的主题 进入代码界面后 点击进入下面的按钮 然后进行保存 到对应的文件夹下
  • 【粉丝问答10】C语言关键字static的使用详解

    粉丝提问 粉丝问题 总结一下 关键字static的使用方法 要想搞清楚关键字static的使用方法 必须首先搞清楚 可执行程序段的分类以及各段在内存区的逻辑地址的映射 一 可执行程序内存分配 1 可执行程序程序分段 一个程序的3个基本段 t
  • 安卓常见内存泄露解决办法

    1 如果有打开Dialog 一定要在Activity的Destroy释放 否则有可能造成Activity异常退出时的内存泄露 Override protected void onDestroy super onDestroy if prog
  • 子串和子序列(python)

    子串 串中任意个连续的字符组成的子序列称为该串的子串 子序列 序列的一部分项按原有次序排列而得的序列 coding utf 8 1 连续子串最大和 def MaxSum arr res s arr 0 arr 0 for x in arr
  • 二叉树专题

    二叉树专题 二叉树的存储与基本操作 二叉树的遍历 先序遍历 中序遍历 后序遍历 层次遍历 利用先序遍历和中序遍历构造二叉树 二叉树的静态实现 一般的树 存储 新建结点 遍历 代码来源 晴神 算法笔记 二叉树的存储与基本操作 定义 struc
  • Git部署与使用

    Git部署与使用 欢迎关注 攻城狮Gala 公 众 号 每天一起学习 努力成为Web3全栈 摘要 当你有自己的服务器 同时期望私有化进行版本管理内容 or 代码 部署自己的Git服务器是一个绝佳选择 背景 之前折腾笔记同步 虽然已经有S3可
  • java ee考试题_Java-EE考试习题

    Java EE考试习题 如果缺少破土面出并与风雪拚搏的勇气 种子的前途并不比落叶美妙一分 以下是小编为大家搜索整理了Java EE考试习题 希望能给大家带来帮助 更多精彩内容请及时关注我们应届毕业生考试网 第一章 1 JavaEE架构中各层
  • 基于python技术的电商母婴购物数据分析

    人生苦短 我用python Python其他实用资料 点击此处跳转文末名片获取 一 数据集概述 今天我们来看一个来着阿里云天池的数据集 淘宝母婴购物数据 有两个csv文件 mum baby csv mum baby trade histor