Python2_Pandas库(数据读取)

2023-11-09

1.数据读取

food_info.csv数据
在这里插入图片描述

import pandas
food_info=pandas.read_csv("food_info.csv")#read_csv函数读取csv数据文件
print(type(food_info))#DataFrame是pandas的核心
print(food_info.dtypes)#该CSV文件的主要的数据类型
print(help(pandas.read_csv))

<class ‘pandas.core.frame.DataFrame’>

NDB_No int64
Shrt_Desc object
Water_(g) float64
Energ_Kcal int64
Protein_(g) float64
Lipid_Tot_(g) float64
Ash_(g) float64

food_info.head()#默认打印出数据的前五条数据,()内可以指定显示多少行

在这里插入图片描述

food_info.tail(3)#显示后三行

在这里插入图片描述

col=food_info.columns    #把其所有的列名赋值给col
print(col)

在这里插入图片描述

sh=food_info.shape         #当前数据的规模,也就是行列,行代表数据个数,列代表数据的指标
print(sh)

(8618, 36)

2.索引与计算

print(food_info.loc[1])     
#通过loc函数定位数据的索引,获取数据元素的值(一行)

在这里插入图片描述

ndb=food_info["NDB_No"]   #将其整列赋值给ndb
print(ndb)

在这里插入图片描述

col=["NDB_No","Shrt_Desc"]          
 #将数据的两列赋值给col,col作为定位,打印出其两列的值
ndb=food_info[col]
print(ndb)

在这里插入图片描述

col_names=food_info.columns.tolist() #将food_info的列名转为一个list列表
print(col_names)      #打印出列名
gram_columns = []      #定义一个空的列表

for c in col_names:              #循环列表
    if c.endswith("(g)"):        #如果列名以“(g)”结尾
        gram_columns.append(c)   #将此列名追加到gram_columns中
gram_g = food_info[gram_columns]  #找到这些列
print(gram_g.head())

在这里插入图片描述

print(food_info["Iron_(mg)"])
Iron_g = food_info["Iron_(mg)"]*1000       #将此列的值转换为以g为单位了
print(Iron_g)

在这里插入图片描述

print(food_info.shape)
Iron_g = food_info["Iron_(mg)"]*1000
food_info["Iron_(g)"] = Iron_g             #添加一列
print(food_info.shape)

在这里插入图片描述

max_Energ_Kcal = food_info["Energ_Kcal"].max()     #找出此列的最大值
print(max_Energ_Kcal)

在这里插入图片描述

3.常用的预处理方法

food_info.sort_values("Energ_Kcal",inplace=True)       
 #调用sort_values函数,默认是升序排列
print(food_info["Energ_Kcal"])
food_info.sort_values("Energ_Kcal",inplace=True,ascending=False)
#ascending=Flase  升序改为降序排列
print(food_info["Energ_Kcal"])

在这里插入图片描述
在这里插入图片描述
titanic_train.csv的数据值

import numpy as np
import pandas as pd
titanic= pd.read_csv("titanic_train.csv")
titanic.head()

在这里插入图片描述

age=titanic["Age"]
print(age.loc[0:10])

在这里插入图片描述

age_null=pd.isnull(age)        #isnull()判断是否是空值
print(age_null)

在这里插入图片描述

age_null_true = age[age_null]         #找出是空值的项
print(age_null_true)

在这里插入图片描述

age_null_len=len(age_null_true)#数据为空值的个数
 print(age_null_len)      

177

mean_age=age.mean()  #平均值
print(mean_age)

29.69911764705882

passager_fare = titanic.pivot_table(index="Pclass",values="Fare",aggfunc=np.mean)
print(passager_fare)
#pivot_table计算两个相关参数间的关系,这里表示的是Pclass船票的等级和其Fare船票价格的关系
#的反应,以Pclass为索引,求取各类等级船票价格的平均值

在这里插入图片描述

pclass_fare_survived = titanic.pivot_table(index="Pclass",values=["Fare","Survived"],aggfunc=np.sum)
print(pclass_fare_survived)
#pclass船票等级与fare船票总价格以及获救总人数之间的关系

在这里插入图片描述

print(titanic.shape)
new_titanic=titanic.dropna(axis=0,subset=["Age","Sex"])
print(new_titanic.shape)
#dropna为去除函数 去除Age和Sex值为空的数据,

在这里插入图片描述

age83=titanic.loc[83,"Age"]       #定位查找第83个数据的Age年龄值
print(age83)

28.0

4.pandas的自定义函数

new_titanic = titanic.sort_values("Age",ascending=False)
new_titanic.loc[0:10]

在这里插入图片描述

new_titanic_reindex = new_titanic.reset_index(drop=True)
new_titanic_reindex.loc[0:10]       #对其进行排序的数据的索引编号从新进行排序

在这里插入图片描述

def hundred_row(column):           #def定义一个函数找出第100行的数据
    hun_item=column.loc[99]
    return hun_item
h_row=titanic.apply(hundred_row)   #apply调用函数
print(h_row)

在这里插入图片描述

5.Series结构

Series一行或者一列,就是向量,称之为Series
在这里插入图片描述

import pandas as pd
fandango_score_comparison = pd.read_csv("fandango_score_comparison.csv")
series_film=fandango_score_comparison['FILM']
print(type(series_film))         #列类型是Series

在这里插入图片描述

from pandas  import Series
series_film_value=series_film.values
print(type(series_film_value))     #Series内的值的类型是ndarray

class 'numpy.ndarray'>
由此可见pandas是在numpy的基础上进行封装的库

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Python2_Pandas库(数据读取) 的相关文章

  • Typora和PicGo-Core搭配使用(解决博客单独上传图片问题)

    前言 本文简单介绍快速上传图片并获取图片 URL 链接的工具 图片存放到Gitee仓库中 在博客网站发布时不必担心图片转存失败问题 解决本地图片在网站需单独上传的难题 将本地图片存储在网络中 图床 并生成URL 联网情况下通过URL链接即可

随机推荐

  • Unity之六:项目实战篇

    文章目录 一 一个简单的实例 二 使用CMake组织项目与Unity 2 1 目录结构 2 2 CMakeLists txt的编写 2 3 使用实例 一 一个简单的实例 一个测试单元是源文件 测试文件和Unity构成的 把他们放在一起进行编
  • 【算法提升】——异或理解,位的运算

    个人主页 努力学习的少年 版权 本文由 努力学习的少年 原创 在CSDN首发 需要转载请联系博主 如果文章对你有帮助 欢迎关注 点赞 收藏 一键三连 和订阅专栏哦 目录 一 只出现一次的数字 1 二 数组中只出现一次的数字2 一 只出现一次
  • localStorage在Safari浏览器无痕模式下失效

    Safari无痕模式是不能使用localStorage的 可以利用这个特性判断用户是否开启无痕模式 并提醒用户关闭无痕模式 if typeof localStorage object try localStorage setItem loc
  • 学习笔记 JavaScript ES6 异步编程Promise

    Promise ES里面对异步操作的第一种方案 学习Promise 让异常操作变得优雅 Promise的精髓在于异步操作的状态管理 一个Promise最基本用法 他的参数是一个方法 这个方法里有两个参数 一个是异步操作执行成功的回调 一个是
  • DC综合脚本中文详细解释

    script for Design Compiler DC综合编译脚本 language TCL 语言说明 Usage 使用说明 1 make sure the lib in the current directory 确保设计库在正确的文
  • Xcode项目设置项中的LLVM

    LLVM是构架编译器
  • html5开发手机打电话发短信功能,html5的高级开发,html5开发大全,html手机电话短信功能详解

    原文地址 http blog csdn net xmtblog article details 32931905 在很多的手机网站上 有打电话和发短信的功能 对于这些功能是如何实现的呢 其实不难 今天我们就用html5来实现他们 简单的让你
  • Angular--官方文档之 Angular CLI

    学习Angular官方文档的时候 参考https angular cn guide quickstart 这个快速开发的文档 对于我这个AngularJs小白在看了Angular菜鸟教程后 只能说可以简单的运用一下 看到一些专业术语 我也是
  • 嵌入式Linux(四)—嵌入式C语言(杂项/数据类型关键字)

    目录 杂项关键字 sizeof Return 数据类型关键字 char 进制 int long short Unsigned signed Float double void 自定义数据类型 Struct Union enum typede
  • cppcheck使用

    cppcheck使用 cppcheck说明 cppcheck能够检查出来的问题 cppcheck使用并生成html结果 生成html结果 cppcheck说明 cppcheck主要用来检查c c 代码的 本文主要讲述cppcheck用命令行
  • Flutter 开发小结

    接触 Flutter 已经有一阵子了 期间记录了很多开发小问题 苦于忙碌没时间整理 最近项目进度步上正轨 借此机会抽出点时间来统一记录这些问题 并分享项目开发中的一点心得以及多平台打包的一些注意事项 希望能对大家有所帮助 UI 组件使用 官
  • Linux 下使用Crontab定时任务同时执行多条定时任务

    Linux 下使用Crontab定时任务同时执行多条定时任务 使用 符连接即可 示例如下 0 6 bea ceos timer bin pb ClosePbManifestTimer sh gt dev null 2 gt 1 bea ce
  • 【高项】质量管理(ITTO)

    过程组 子过程 输入 I 工具和技术 TT 输出 O 规划 1规划质量管理 1 项目章程 2 项目管理计划 需求管理计划 风险管理计划 相关方参与计划 范围基准 3 项目文件 假设日志 需求文件 需求跟踪矩阵 风险登记册 相关方登记册 4
  • QT源码剖析-QT对象通信机制信号槽的绑定具体实现

    本文详细介绍QT核心机制之一 信号和槽 我们在此根据Qt源代码一步一步探究其信号槽的实现过程 核心知识点 模板元编程技术 Qt moc预编译机制 QObject类 目录 1 QObject类介绍 2 相关助手类介绍 2 1 类型 函数指针
  • pip安装出现Could not install packages due to an EnvironmentError: [Errno 2] No such file or directory: '

    问题描述 pip安装库或者更新pip版本时出现如下问题 Could not install packages due to an EnvironmentError Errno 2 No such file or directory c us
  • LeetCode 面试题01.09 字符串轮转

    题目 字符串轮转 给定两个字符串s1和s2 请编写代码检查s2是否为s1旋转而成 比如 waterbottle 是 erbottlewat 旋转后的字符串 示例1 输入 s1 waterbottle s2 erbottlewat 输出 Tr
  • 一个独特的开源插件evil.js

    前言 最近发现一个好玩有解压的开源插件 注意 不可使用在正式项目中 这里分享下 gitee地址 evil js 此代码仅在周日的时候执行以下逻辑 声明 请勿用于任何项目 如果导致任何问题 与本人无关https gitee com haoxi
  • 矩阵LU分解

    一 矩阵LU分解定理 设A为n阶矩阵 如果A的顺序主子式Di 0 i 1 2 n 1 则A可以分解为一个单位下三角矩阵L和一个上三角矩阵U的乘积 且这种分解是唯一的 即A LU 二 矩阵LU分解Python代码 自己原创 def lu de
  • 第十二章 - 条件判断(case when 和 if)和视图

    第十二章 条件判断 case when 和 if 和视图 view if 的用法 case when 的用法 视图 view 的用法 if 的用法 通过使用if函数可以实现数据二分类或者多分类的功能 比如按年龄区分青年 中年 老年 或者按价
  • Python2_Pandas库(数据读取)

    1 数据读取 food info csv数据 import pandas food info pandas read csv food info csv read csv函数读取csv数据文件 print type food info Da