【Python数据科学手册】Pandas——二、Pandas对象简介

2023-11-08

二、Pandas对象简介

1.Pandas的Series对象

Pandas 的 Series 对象是一个带索引数据构成的一维数组。
(注意Series中S大写)
在这里插入图片描述
Series 对象将一组数据和一组索引绑定在一起
在这里插入图片描述
和 NumPy 数组一样,数据可以通过 Python 的中括号索引标签获取
在这里插入图片描述
Pandas 的 Series 对象比它模仿的一维 NumPy 数组更加通用、灵活。

1).Serise是通用的NumPy数组

NumPy 数组通过隐式定义的整数索引获取数值,而 Pandas 的Series 对象用一种显式定义的索引与数值关联。显式索引的定义让 Series 对象拥有了更强的能力。

pd.Series(data=None, index=None, dtype=None, name=None, copy=False, fastpath=False)
  • 自定义索引
    在这里插入图片描述
    在这里插入图片描述
2). Series是特殊的字典

Series 对象其实是一种将类型键映射到一组类型值的数据结构。类型至关重要,使得它在某些操作上比Python 的字典更高效。
在这里插入图片描述
索引默认按照顺序排列。典型的字典数值获取方式仍然有效。
在这里插入图片描述

3). 创建Series对象
pd.Series(data=None, index=None, dtype=None, name=None, copy=False, fastpath=False)

data : array-like, dict, or scalar value
Contains data stored in Series

index 是一个可选参数, data 参数支持多种数据类型。
上述可知,data可以是列表、numpy数组、字典来创建Series对象。data本身是一个Series对象也没问题。
另外,data还可以是标量,创建 Series 对象时会重复填充到每个索引上
在这里插入图片描述
每一种形式都可以通过显式指定索引筛选需要的结果。
在这里插入图片描述

2.Pandas的DataFrame对象

和Series 对象一样, DataFrame既可以作为一个通用型 NumPy 数组,也可以看作特殊的 Python 字典。
(注意DataFrame中D和F大写)

1). DataFrame是通用的NumPy数组

DataFrame 可以看作是一种既有灵活的行索引,又有灵活列名的二维数组。可以把 DataFrame 看成是有序排列的若干 Series 对象。

pd.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)

在这里插入图片描述
取索引名和列名
在这里插入图片描述

2). DataFrame是特殊的字典

字典是一个键映射一个值,而 DataFrame 是一列映射一个 Series 的数据。
在这里插入图片描述
切片取值见下一节。

3).创建DataFrame对象
pd.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)

data : numpy ndarray (structured or homogeneous), dict, or DataFrame
Dict can contain Series, arrays, constants, or list-like objects

可见创建DataFrame的方法有很多种

  1. 单个Series
    在这里插入图片描述

  2. 字典列表
    在这里插入图片描述

  3. Series对象字典
    上文中的DataFrame对象states就是用Series 对象字典un_dict构造的

  4. NumPy 二维数组
    在这里插入图片描述
    dataframe二维数据(矩阵):

x=df.values

.values可以使得series或dataframe转array

  1. NumPy 结构化数组
    在这里插入图片描述
  2. 其他列表样式对象
    在这里插入图片描述

3. Pandas的Index对象

Series 和 DataFrame 对象都使用便于引用和调整的显式索引。可以将Index 对象看作是一个不可变数组或有序集合(实际上是一个多集,因为 Index 对象可能会包含重复值)。
(注意Index中I大写)
在这里插入图片描述

1).将Index看作不可变数组

可以通过标准 Python 的取值方法获取数值,也可以通过切片获取数值
在这里插入图片描述
与 NumPy 数组相似的属性,但 Index 对象的索引是不可变的,Index 对象的不可变特征使得多个 DataFrame 和数组之间进行索引共享时更加安全
在这里插入图片描述

2).将Index看作有序集合

Index 对象遵循 Python 标准库的集合(set)数据结构的许多习惯用法,包括并集、交集、差集等
在这里插入图片描述
备注:
tolist()序列转列表

df_hx['核心品类'].tolist()
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【Python数据科学手册】Pandas——二、Pandas对象简介 的相关文章

  • MySQL-show databases数据库显示不完整

    由于我的电脑不是单独安装的MySQL 而是选择安装的xampp这款软件 最近在命令行下操作数据库时发现了一点小问题 就是当我输入show databases 之后数据库显示不完整 简单的说 就是因为我选择的用户不正确导致的 当我们直接输入m
  • pytorch中torchvision.transforms.functional模块中pad函数的使用

    torchvision transforms functional模块中pad函数的使用 载入torchvision transforms functional模块 import torchvision transforms functio
  • C++/QT 获取系统CPU、内存、磁盘、进程相关信息

    最近在学习用C 获取WINDOWS和LINUX 下的系统信息 对其大概方法做了一些总结 希望对新人有一些帮助 话不多说 先来代码 首先 我针对两个平台定义了一个接口类 即纯虚函数类 其windows 和 linux 的实现类可以实现该类 接
  • Paper Reading: RSPrompter,基于视觉基础模型的遥感实例分割提示学习

    目录 简介 目标 工作重点 方法 实验 总结 简介 题目 RSPrompter Learning to Prompt for Remote Sensing Instance Segmentation based on Visual Foun
  • 复杂综合类型问题的定位思路

    文章目录 复杂综合类型问题的定位思路 定位思路 常见定位工具 文本操作 文件操作 网络和进程 其它常用 复杂综合类型问题的定位思路 定位思路 常见定位工具 文本操作 文本查找 grep 文本分析 awk 文本处理 sed 文件操作 文件监听
  • python 求最大内切圆和最小外接圆问题

    记录 一 求最大内切圆 图片应该是要一张二值图像 这个有程序可以将其变成 cv2 用cv2来的findcontours 函数先找到图像中每一个连通域的轮廓 然后遍历轮廓 计算每一点到轮廓的距离 pointpolygontest 函数 再用m
  • 2020年秋招嵌入式软件面试过程总结(华为联发科小米兆易创新)

    秋招投递公司23家 简历被刷1家 笔试 测评挂掉3家 至今无消息的8家 获得Offer的公司有小米 兆易创新 全志科技 浙江大华 海格通信 京信通信 景嘉微电子 广州朗国电子 北京华大电子 中国长城科技集团 文章目录 有面试 联发科北京 7
  • shiro框架---通过系统介绍shiro框架中的实现逻辑

    接上一篇文章关于shiro框架的简单介绍及用户表的建立维护 项目已分享到GitHub上 如果需要的可以看下 springboot shiro项目Git下载地址 本篇主要通过一个已经实现用户登录和权限验证的系统 结合sql 展示一下我的实现
  • 听说你开发.NET还在用VS,小哥哥给你推荐全平台的Rider

    前言 NET平台的开发一直都只能使用Visual Studio来开发 自从dotnet core 发布后不久 jetbrains 发布了Rider预览版 到目前为止的正式版2017 3 1 博主都使用过 因为博主的主力开发语言是C 所以一直
  • 你不知道的JavaScript-----词法作用域

    作用域 引擎就是老大 是终极控制中心 控制整个程序的执行 编译器是协助引擎解析程序 而作用域是解析程序的一种规则 注意 无论函数在哪里调用 也无论它如何被调用 它的词法作用域都只由函数被声明时所处的位置决定 词法阶段 词法作用域就是定义在词
  • 基于vue的文件夹上传插件

    基于vue simple uploader封装文件分片上传 秒传及断点续传的全局上传插件 1 前言 之前公司要在管理系统中做一个全局上传插件 即切换各个页面的时候 上传界面还在并且上传不会受到影响 这在vue这种spa框架面前并不是什么难题
  • statsmodels API

    1 介绍 主要的 statsmodels API 分为以下模块 statsmodels api 横截面模型和方法 statsmodels tsa api 时间序列模型和方法 statsmodels formula api 使用公式字符串和
  • 《数学建模与数学实验》第5版 非线性规划 习题4.4

    文章目录 1 一电路由三个电阻 R 1 R 2
  • JAVA框架03 -- Spring

    概念相关 spring 是什么 Spring 是分层的 Java SE EE 应用 full stack 轻量级开源框架 以 IoC Inverse Of Control 反转控制 和 AOP Aspect Oriented Program
  • JavaWeb核心技术——Web概述

    目录 1 Web概述 1 1 Web和JavaWeb的概念 1 2 JavaWeb技术栈 1 2 1 B S架构 1 2 2 静态资源 1 2 3 动态资源 1 2 4 数据库 1 2 5 HTTP协议 1 2 6 Web服务器 1 Web
  • 【华为OD】

    目录 一 题目描述 二 输入描述 三 输出描述 用例 四 题目解析 五 Java玩法 六 JavaScript玩法 一 题目描述 给定两个字符串 s1 和 s2 和正整数 K 其中 s1 长度为 n1 s2 长度为 n2 在 s2 中选一个
  • 跳频技术——学习总结(一)

    跳频技术 学习总结 一 开始跳频的学习快一个月了吧 最近才停下其它事情 集中时间看了一些内容 资料有 跳频通信干扰与抗干扰技术 那丹彤 跳频通信 梅文华 和网上百度的各种资料 一 扩频概念和分类 扩频通信 一种利用与信息无关的伪随机序列使射
  • Linux之GPIO应用

    目录 一 sysfs 文件系统 二 LED标准接口 三 GPIO标准接口 1 gpiochipX 2 export direction value active low edge 3 unexport 在 Linux 系统下 一切皆文件 应
  • 外包的水太深了,18k的阿里外包不太敢去.....

    有挺多测试员曾在BAT 网易这些大厂做过外包 想必大家也是非常关心此类问题 我就想介绍下 什么是外包 外包公司的现状 就 为什么这么多人鄙视外包测试岗 阿里18K的外包测试岗能去吗 谈谈自己的想法 什么是外包 外包指企业在管理系统实施过程中

随机推荐

  • Environment Modules

    什么是 Environment Modules 通常 用户在登录时通过为会话期间要引用的每个应用程序设置环境信息来初始化其环境 Environment Modules包 是一个简化shell初始化的工具 它允许用户在使用 modulefil
  • JSTL的基本使用

    开发工具与关键技术 IDEA 撰写时间 2022 8 28 前提 创建一个java Maven项目 并把 Tomcat 装上 并在后端传数据到jsp页面 在 pox xml文件下导入该jar包
  • WEB_HCTF_2018_WarmUp

    Categories web 代码审计 write up source code get source code http eb22847d 9f8a 4ecf b972 5ecebfcf5faf node3 buuoj cn source
  • C++ sizeof() 和一道面试题

    首先要明确sizeof不是函数 也不是一元运算符 他是个类似宏定义的特殊关键字 sizeof 括号内在编译过程中是不被编译的 而是被替代类型 如int a 8 sizeof a 在编译过程中 它不管a的值是什么 只是被替换成类型sizeof
  • 使用Jsoncpp生成和解析Json字符串

    上一篇 同大家一起分享了QJson的移植 Qt4 8 3 使用技巧 如何移植和使用QJson 本篇我们来熟悉下使用Jsoncpp生成和解析Json字符串 当然作为Qt的狂热爱好者 我还是会继续改造Jsoncpp项目 来一个Qt项目版 需要下
  • 欧姆龙PLC伺服功能块 功能块可供选择脉冲0-3,脉冲输出方式CW/CCW或者脉冲加方向

    欧姆龙PLC伺服功能块 功能块可供选择脉冲0 3 脉冲输出方式CW CCW或者脉冲加方向 一个功能块实现伺服点动 相对位置 绝对位置 伺服回原点所有操作 所有一些标志位 都有对应的输入和输出 程序里都有讲解和注明 ID 6920615056
  • redis应用之缓存穿透、缓存击穿、缓存雪崩

    redis应用之缓存穿透 缓存击穿 缓存雪崩 记录一下redis应用中常见的三大问题 首先看一下应用redis作为缓存的系统数据访问的架构图 客户端发起一个查询请求的时候 首先去缓存中查询 如果数据在缓存中存在 则直接将缓存中的数据返回给客
  • 解决Eclipse EE部署web项目在Tomcat webapp目录下没有工程文件的问题

    之前本人在进行web应用开发时用的都是 MyEclipse 最近在用 Eclipse EE 进行 web 应用开发时却发现成功部署后 在Tomcat 的 webapps 目录下没有相关的工程文件 要知道在使用MyEclipse的时候是默认部
  • 7、使用IO流读取指定文件内容,并完成相关操作

    编程题目 7 从类似如下的文本文件中读取出所有的姓名 并打印出重复的姓名和重复的次数 并按重复次数排序 1 张三 28 2 李四 35 3 张三 28 4 王五 35 5 张三 28 6 李四 35 7 赵六 28 8 田七 35 示例代码
  • FM1722/02NL+STM32硬件SPI调试笔记

    1 介绍 FM17XX 系列通用非接触读卡机芯片是复旦微电子股份有限公司设计的 基于 ISO14443 标准的系 列通用非接触卡读卡机芯片 采用 0 6 微米 CMOS EEPROM 工艺 FM17XX 系列读卡机芯片可分别支持 13 56
  • vi编辑文件时查找字符串

    原文地址 http vieri blog 51cto com blog 1950953 373639 使用vi编辑器编辑长文件时 常常是头昏眼花 也找不到需要更改的内容 这时 使用查找功能尤为重要 一 常规查找 方法如下 1 命令模式下输入
  • PTA 基础编程题目集 7-20 打印九九口诀表 C语言

    PTA 基础编程题目集 7 20 打印九九口诀表 C语言 下面是一个完整的下三角九九口诀表 本题要求对任意给定的一位正整数N 输出从11到NN的部分口诀表 输入格式 输入在一行中给出一个正整数N 1 N 9 输出格式 输出下三角N N部分口
  • ❤️【数据结构】之单链表的增、删、查、改(C语言实现)看一遍就会!!!

    文章目录 前言 作者简介 一 单链表 二 1 单链表结构 2 创建新节点 3 单链表的头插 2 单链表的尾插 3 单链表的头删 4 单链表的尾删 5 找到某个值的位置 6 在任意值前面插入值 7 删除任意位置的值 8 打印链表 9 主函数
  • Elasticsearch基本操作

    1 数据格式 Elasticsearch是面向文档型数据库 一条数据在这里就是一个文档 为了方便理解 我们将Elasticsearch里存储文档数据和关系型数据库MySQL存储数据的概念进行类比 这里 Types 的概念已经被逐渐弱化 El
  • 联机手写汉字识别,基于新型RNN网络结构的方法

    本文简要介绍2019年4月Pattern Recognition录用论文 RecognizingOnline Handwritten Chinese Characters Using RNNs with New Computing Arch
  • Unity的Input.GetAxis()的返回值

    Unity的Input GetAxis float moveHorizontal Input GetAxis Horizontal 水平的向左是 1 向右是1 静止返回值是0 float moveVertical Input GetAxis
  • 使用boost::range模块进行反转操作的相关测试程序

    使用boost range模块进行反转操作的相关测试程序 在C 中 使用第三方库可以帮助我们更方便地进行各种操作 boost库是一个受欢迎的C 库之一 提供了许多功能强大的模块 其中 boost range模块为我们提供了一组用于操作范围的
  • 一线大厂的企业云原生成本优化实践指南

    胡忠想 星汉未来联合创始人 CPO 读完需要 18分钟 速读仅需 6 分钟 1 前言 近年来 公有云 混合云等技术在全球迅速发展 云的普及度越来越高 Docker Kubernetes DevOps Service Mesh 等云原生技术蓬
  • 软件测试常见面试题

    文章目录 1 你的测试职业发展是什么 2 你认为测试人员需要具备哪些素质 3 你为什么能够做测试这一行 4 测试的目的是什么 5 测试分为哪几个阶段 6 单元测试的测试对象 目的 测试依据 测试方法 7 怎样看待加班问题 8 结合你以前的学
  • 【Python数据科学手册】Pandas——二、Pandas对象简介

    文章目录 二 Pandas对象简介 1 Pandas的Series对象 1 Serise是通用的NumPy数组 2 Series是特殊的字典 3 创建Series对象 2 Pandas的DataFrame对象 1 DataFrame是通用的