【R语言】实验二基本数据处理

2023-10-29

系列文章目录

实验一 R 语言数据结构、数据导入与数据处理

实验二基本数据处理

实验三数据可视化

实验四数据分析

实验五综合应用

实验数据

实验数据下载

1. item_feature1 数据集字段


date	日期	item_id	商品ID
cate_id	仓库ID	cate_level_id	仓库级别ID
brand_id	品牌ID	supplier_id	供应商ID
pv_ipv	浏览次数	cart_uv	加购人次
collect_uv	收藏人次	cart_ipv	被加购次数

提示：以下是本篇文章正文内容

一、实验目的

变量创建、变量重编码、缺失值、日期值处理，数据类型转化，数据排序。
数据集的合并，选取子集，使用 SQL 操作数据框，数据的整合与重构。
控制流：条件与循环。
用户自编函数。

二、实验内容

题目1

将 item_feature1.csv 读入，存储到 df 中；并给 df 的列分别命名为：date、item_id、cate_id、cate_level_id、brand_id、supplier_id、pv_ipv、cart_uv、collect_uv 和 cart_ipv 。
为 df 中的 cart_uv 重新编码并将新变量命名为 recode，将小于 5000 的归为less,将大于等于 5000 小于 15000 的归为 common,其他的归为 many；查看尾部的 10 条数据。
查看 df 中是否有缺失值；如有缺失值，删除 df 中所有含缺失值的行。
将 df 中的 date 字段转换成日期类型，如：2015-02-13。
将 df 按照 date 字段升序排列，另存为 df_asc；并查看前 10 条数据。
将 df 按照 date 字段升序和 item_id 降序排序，另存在 df1 中；并查看前 5条数据。

题目2

从 df 中选取 date 、item_id 、cate_id 、cart_uv 、recode、collect_uv 和cart_ipv 字段另存为 df1；剔除 df1 中的 cart_ipv 字段另存为 df2；从 df1 中选取 item_id 大于 500 的并且 recode 为 less 的数据另存为 df3。
从 df 中选取 date 为 2015-02-14，item_id 为 300，并保留 date 到 supplier_id其间的所有列，另存为 df_sub。
从 df 中无放回的随机抽取 500 条样本，另存为 df4；查看样本的维度和数据的头部数据。
从 df1 中选取列从 item_id 到 cate_id 的数据，另存为df1_temp,然后与 df按照 item_id 合并存为 df5。
从 df1 中利用 sql 的方法选取 item_id 为 300 的数据，另存为 df6 中。
从 df2 中有放回的随机取出与 df6 一样多的数据条数做为df_tem，然后与 df6按列（横向）合并，另存为 df7。
从 df 中选取 date 、item_id、cate_id 和 cart_ipv 另存为 feature，并将 feature按日期升序排列，取出 feature 中唯一的 cate_id（去重即可）。

三、实现过程与实验结果

题目1

1.将 item_feature1.csv读入存储到df中；并给df的列分别命名为：date 、item_id 、cate_id、cate_level_id 、brand_id 、supplier_id 、pv_ipv 、cart_uv 、collect_uv 和 cart_ipv。

# 读取数据存储到df中
df <-
  read.csv(
    "R\\data\\ex2\\item_feature1.csv"
  )

# 查看原始变量名
names(df)
##  [1] "X20150628" "X300"      "X36"       "X4"        "X657"      "X294"     
##  [7] "X33"       "X19"       "X1"        "X1.1"

# 重命名
names(df)[1:

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

R语言

【R语言】实验二基本数据处理的相关文章

mysql强制指定查询使用的索引

语法 select from table name force index index name where conditions 例如 mysql强制使用指定索引查询 SELECT FROM yrd pay flow FORCE INDE

随机推荐

图解Netty之Pipeline、channel、Context之间的数据流向。

以下所绘制图形均基于Netty4 0 28版本一 connect outbound类型事件当用户调用channel的connect时会发起一个outbound类型的事件该事件将在pipeline中传递 pipeline connec
PAT 乙级 1035 插入与归并（C语言）

题目根据维基百科的定义插入排序是迭代算法逐一获得输入数据逐步产生有序的输出序列每步迭代中算法从输入序列中取出一元素将之插入有序序列中正确的位置如此迭代直到全部元素有序归并排序进行如下迭代操作首先将原始序列看成 N 个只包
SetupSTM32CubeProgrammer安装教程

SetupSTM32CubeProgrammer安装教程下载地址 ST官方网站链接 link https www st com en development tools stm32cubeprog html 环境准备笔主是下载好就开始
Java 多线程共享模型之管程（上）

主线程与守护线程默认情况下 Java 进程需要等待所有线程都运行结束才会结束有一种特殊的线程叫做守护线程只要其它非守护线程运行结束了即使守护线程的代码没有执行完也会强制结束 package Daemon import lombo
系统分析师案例题【数据库篇】

目录 1 规范化与反规范化 1 1 数据库设计过程 1 2 范式 1 3 反规范化 2 数据库索引 3 数据库视图 4 分区分表分库 5 分布式数据库系统 6 NoSQL 7 联邦数据库系统 8 数据库的性能优化 9 大数据 1 规范化与反
Java之网络编程

文章目录 1 B S和C S架构 1 1B S架构 1 2C S架构 2 http协议 2 1http协议的特点 2 2http请求格式 2 3http响应格式 3 UDP协议 4 TCP协议 DNS域名解析 6 socket 6 1Ine
问题：pycharm里面调用mysql失败

项目场景 pycharm调用mysql的时候连接数据库错误排除密码账户语句等常规错误问题 Could not connect server may not be running import pymysql 建立数据库连接 con
Dirty cow提权（脏牛）CVE-2016-5195 演示

漏洞原理脏牛 Linux内核的内存子系统在处理写入时复制时产生了竞争条件指的是任务执行顺序异常导致应用崩溃或者使得攻击者利用其漏洞进一步执行其他代码最终攻击者可对其目标进行提权获得root权限提权下载EXP root kali
Spring Security OAuth2.0(二)-----简化模式/密码模式/客户端模式/刷新 token

简化模式代码示例修改authorization server授权服务模块新增 implicit 和修改回调地址为本次地址修改第三方应用项目搭建新页面模拟新建implicit jsp
如何搭建个人博客网站【图/文教程】

一个人博客网站大多人都用过一些社交平台上的博客如QQ空间新浪微博网易博客等等但这些大多都是面向大众平台而且不是自己独有自由的博客想搭建一个属于自己的博客网站其实很简单那么这篇文章会教会你如何进行搭建二介绍一些开源免
Yolov8网络详解与实战（附数据集）

文章目录摘要模型详解 C2F模块 Loss head部分模型实战训练COCO数据集下载数据集 COCO转yolo格式数据集适用V4 V5 V6 V7 V8 配置yolov8环境训练断点训练测试训练自定义数据集 Label
回发或回调参数无效，如何解决

回发或回调参数无效在配置中使用
【MyIbatis】MyBatis 核心配置综述之Executor

1 概述转载 MyBatis 核心配置综述之Executor 上一篇我们对SqlSession和SqlSessionFactory的创建过程有了一个详细的了解但上述的创建过程只是为SQL执行和SQL映射做了基础的铺垫而已就和我们Spr
笔记：深度学习与有向无环图SVM结合用于年龄估计的局部调整

阅读论文 Combined Deep Learning With Directed Acyclic Graph SVM for Local Adjustment of Age Estimation IEEE Journals Magazin
codeblocks安装(自带gcc编译器)

下载安装自带c编译器的的codeblocks 网址 http www codeblocks org downloads 26 自带gcc编译器的版本 codeblocks 16 01mingw setup exe 安装完成后打开IDE界面
vue-router之addRoutes（动态路由/权限路由）使用分析

1 设置默认路由 2 由登录获取权限路由动态路由要存储routes数据防止刷新时数据丢失刷新时要重新动态渲染路由 var routes sessionStorage setItem routes JSON stringify rou
k8s常用命令

kubectl get pod n
最新Android WebView Websettings设置， Android WebView加载网页布局错乱，在Android4.4新版本之后WebSettings新增设置。

两张图片对比后你会发现第一张加载web网页的布局乱了原因 Android4 4 API 版本 19 提供了一个基于 Chromium 版本的新版本 WebView 不再是webkit了所以在对websettings的设置中我们需要多添
Kali Linux相关简介及安装与配置【保姆式教程】

提示新手博主请大家多多关照每天都要加油鸭目录前言一 Kali Linux介绍 1 包括600多个渗透测试工具 2 免费的就像啤酒一样而且用永远都是 3 开源Git树 4 符合FHS 5 广泛的无线设备支持 6 安全的环境中开
【R语言】实验二基本数据处理

系列文章目录实验一 R 语言数据结构数据导入与数据处理实验二基本数据处理实验三数据可视化实验四数据分析实验五综合应用实验数据实验数据下载 1 item feature1 数据集字段 date 日期 item id 商

【R语言】实验二 基本数据处理