【python基础】【pandas】读取数据pd.read_csv、列表切片iloc、转换成数组to_numpy

2023-10-27

  • 读取数据保存到data中,路径根据你保存的train.csv位置而有变化 big5 是专门针对台湾繁体的。

data = pd.read_csv('D:/pycharm/HungYiLiData/hw1/train.csv', encoding='utf-8')
# data = pd.read_csv('D:/pycharm/HungYiLiData/hw1/train.csv', encoding='big5')
# print(data)
  • 切片:冒号前行数,冒号后列数
    行保留所有,列从第三列开始往后才保留,这样去除了数据中的时间、地点、参数等信息
data = data.iloc[:, 3:]
# print(data)
  • 将所有NR的值全部置为0方便之后处理
data[data == 'NR'] = 0
# print(data)
  • 将 DataFrame 转换为 NumPy 数组。
    将data的所有数据转换为二维数据并用raw_data来保存
raw_data = data.to_numpy()
# print(raw_data)
# 可以每一步都打印出结果,看到数据的变化
DataFrame.to_numpy(dtype=None, copy=False, na_value=NoDefault.no_default)

默认情况下,返回数组的 dtype 将是 DataFrame 中所有类型的通用 NumPy dtype。例如,如果 dtypes 是 float16 和 float32 ,则结果 dtype 将是 float32 。这可能需要复制数据和强制值,这可能很昂贵。

参数:
dtype:str 或 numpy.dtype,可选
要传递给 numpy.asarray() 的 dtype。

copy:布尔值,默认为 False
是否确保返回值不是另一个数组上的视图。请注意,copy=False 并不能确保 to_numpy() 是 no-copy。相反,copy=True 确保制作副本,即使并非绝对必要。

na_value:任意,可选
用于缺失值的值。默认值取决于dtype 和 DataFrame 列的 dtypes。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【python基础】【pandas】读取数据pd.read_csv、列表切片iloc、转换成数组to_numpy 的相关文章

随机推荐

  • Conda——报错解决:CondaError: Cannot write to /.condarc Caused by PermissionError(13, ‘Permission denied‘)

    报错详情 解决方法 sudo chown R pc home pc condarc sudo chown R pc home pc anaconda3 pc 替换你的用户名 home pc anaconda3替换为你的anaconda路径
  • 基础算法题——牛牛的棋盘(容斥原理)

    容斥原理 一种计数方法 先不考虑重叠的情况 把包含于某内容中的所有对象的数目先计算出来 然后再把计数时重复计算的数目排斥出去 使得计算的结果既无遗漏又无重复 题目 牛客网 牛牛最近在家里看到一个棋盘 有 n m 个格子 在棋盘旁边还放着 k
  • SpringBoot学习路线

    SpringBoot 第一章Xml和JavaConfig 1 为什么要使用springboot 因为spring springmvc需要使用大量的配置文件 xml文件 还需要配置各种对象 把使用的对象放入到spring容器中才能使用对象 需
  • 【mysql基础知识】查询当前时间之前5分钟内的数据

    通过sql语句查询与当前时间相隔5分钟以内的数据 select from 数据表名 where 字段名 between date add now interval 5 minute and now 字段名是字符串格式 也是可以的
  • 数据仓库架构

    这节来说说数据仓库的架构 关于架构并没有一个统一的标准 按照数据量以及使用环境可以搭建适合当下场景的数据仓库 下面主要是介绍比较大众或者说比较通用的数据仓库架构 传统的数据仓库架构按层级可分为 ETL ODS DWD DWS 和 ADS 五
  • JDBC java连接数据库

    JDBC编程六步 注册驱动 告诉java程序 即将连接那个品牌的数据库 Driver driver new com mysql jdbc Driver DriverManager registerDriver driver 或 class
  • Maven的scope=import

    详解内容 maven有个核心文件 名曰pom xml 这个文件中的标签 简直是眼花缭乱 千姿百态 而标签中的值也非常之多 今天我们就scope标签其中一个值import 讲解一番 scope标签的作用 这里不作过多的赘述 不明白的小伙伴 可
  • 基于跳数,时延,带宽的最短/优路径和负载均衡

    基于跳数的最短路径转发 基于跳数的最短路径转发是最简单的最优路径转发应用 我们通过network awareness应用来实现网络拓扑资源的感知并计算最短路径 首先控制器通过下发LLDP报文来获取网络链路信息 然后再利用网络信息 生成网络拓
  • sklearn决策树预剪枝

    老饼讲解机器学习 http ml bbbdata com teach 102 目录 一 预剪枝即调参 二 调参方法 1 默认值预观察生长的树 2 参数限制节点过分生长 为预防模型过拟合 我们可以采用预剪枝和后剪枝方法 1 预剪枝 树构建过程
  • git错误pathspec did not match any file(s) known to git及相关操作

    git error pathspec did not match any file s known to git 本地文件与远程无对应 我这里的情况是在执行 update nrp update all git pull Already up
  • python 连接minio并上传目录及文件

    目录 python sdk安装 python 代码 python sdk安装 python需要3 7及以上版本 pip3 install minio python 代码 from minio import Minio from minio
  • web服务器设置默认网站,web服务器中默认首页和默认网站的配置(以apache服务器为例)...

    默认首页的配置 php 第一种 直接修改apache服务器的配置文件 conf httpd conf中的DirectoryIndex 如 项目web以index php为首页 html DirectoryIndex index html i
  • Python追加文件内容

    Python追加文件内容 测试中需要造几百个账号 写了个脚本可以自动生成账号 但想把生成的账号写入一个文件 开始用的如下的write 方法 发下会先把原文件的内容清空再写入新的东西 文件里面每次都是最新生成的一个账号 mobile Meth
  • c++调用libcurl示例

    include
  • 【STM32】STM32存储映射

    存储映射 stm32f40xx的存储映射图 这幅图很重要 至于为什么 我还没编好 STM32存储空间有多大 芯片能访问的存储空间有多大 为什么 这个是由芯片内 CPU 的地址总线的数量决来定的 STM32 芯片内部的地址总线为32 根 1根
  • flutter开发实战-实现marquee根据文本长度显示文本跑马灯效果

    flutter开发实战 实现marquee文本跑马灯效果 最近开发过程中需要marquee文本跑马灯效果 这里使用到了flutter的插件marquee 效果图如下 一 marquee 1 1 引入marquee 在pubspec yaml
  • 第一课:VxWorks系统概述

    目录 1 1 VxWorks系统简介 1 2 VxWorks的特点 1 3VxWorks系统和Linux系统的区别 1 4 VxWorks开发环境获取 1 1 VxWorks系统简介 VxWorks 操作系统是美国WindRiver公司于1
  • matlab中如何对一个小数取整,学习笔记153—matlab中小数如何取整?

    matlab中小数取整的函数大约有四个 floor ceil round fix 1 round取整方法是四舍五入 round函数功能 四舍五入取整 使用方法 B round A 对数组A中每个元素朝最近的方向取整数部分 并返回与A同维的整
  • 在微信小程序中如何使用wx.onLocationChange(function callback)

    参考文档 点这里 其实我使用这个挨批之前用的是wx getLocation文档点这里 可是很无奈 产品的需求是要从首页点进去的时候获取一次用户坐标 可是如果用户频繁点击在真机上就会出现获取不到的情况 会报以下的错误 如下图所示 所以很尴尬
  • 【python基础】【pandas】读取数据pd.read_csv、列表切片iloc、转换成数组to_numpy

    读取数据保存到data中 路径根据你保存的train csv位置而有变化 big5 是专门针对台湾繁体的 data pd read csv D pycharm HungYiLiData hw1 train csv encoding utf