鸢尾花数据集未显示“物种”列

2024-03-24

我正在 Python 上使用 numpy 和 pandas 来学习如何处理数据帧。

我正在 Collaboratory 上编码，并且已加载 Iris 数据集，但由于某种原因，我的数据框中没有“物种”列。也许我以错误的方式加载了它？我很乐意就此事提供帮助。

我添加了一个图像，如果仍然需要代码，那么这就是我所拥有的：

import numpy as np
import pandas as pd
from sklearn.datasets import load_iris

df = pd.DataFrame(load_iris().data, columns=load_iris().feature_names)

Try:

import numpy as np
import pandas as pd 
from sklearn.datasets import load_iris

iris = load_iris()

df = pd.DataFrame(data=np.c_[iris['data'], iris['target']],
                  columns= iris['feature_names'] + ['target']).astype({'target': int}) \
       .assign(species=lambda x: x['target'].map(dict(enumerate(iris['target_names']))))

Output:

>>> df
     sepal length (cm)  sepal width (cm)  petal length (cm)  petal width (cm)  target    species
0                  5.1               3.5                1.4               0.2       0     setosa
1                  4.9               3.0                1.4               0.2       0     setosa
2                  4.7               3.2                1.3               0.2       0     setosa
3                  4.6               3.1                1.5               0.2       0     setosa
4                  5.0               3.6                1.4               0.2       0     setosa
..                 ...               ...                ...               ...     ...        ...
145                6.7               3.0                5.2               2.3       2  virginica
146                6.3               2.5                5.0               1.9       2  virginica
147                6.5               3.0                5.2               2.0       2  virginica
148                6.2               3.4                5.4               2.3       2  virginica
149                5.9               3.0                5.1               1.8       2  virginica

[150 rows x 6 columns]

如何创建species专栏来自target and target_names列？

>>> iris['target_names']
array(['setosa', 'versicolor', 'virginica'], dtype='<U10')
# index 0: setosa
# index 1: versicolor
# index 2: virginica

>>> iris['target']
array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2,
       2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2,
       2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2])

您只需要一个字典映射即可将 0 替换为“setosa”，将 1 替换为“versicolor”，将 2 替换为“virginica”。使用enumerate创建元组列表[(0, 'setosa'), (1, 'versicolor), (2, 'virginica')] then dict` 转换为字典：

>>> dict(enumerate(iris['target_names']))
{0: 'setosa', 1: 'versicolor', 2: 'virginica'}

Now Series.map将映射相应的值：

>>> df['target'].map(dict(enumerate(iris['target_names'])))
0         setosa
1         setosa
2         setosa
3         setosa
4         setosa
         ...    
145    virginica
146    virginica
147    virginica
148    virginica
149    virginica
Name: target, Length: 150, dtype: object

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

DataFrame

Dataset

irisdataset

鸢尾花数据集未显示“物种”列的相关文章

minAreaRect OpenCV 返回的裁剪矩形 [Python]

minAreaRectOpenCV 中返回一个旋转的矩形如何裁剪矩形内图像的这部分 boxPoints返回旋转矩形的角点的坐标以便可以通过循环框内的点来访问像素但是在 Python 中是否有更快的裁剪方法 EDIT See code在
检查子字符串是否在字符串列表中？

我之前已经找到了这个问题的一些答案但它们对于当前的Python版本来说似乎已经过时了或者至少它们对我不起作用我想检查字符串列表中是否包含子字符串我只需要布尔结果我找到了这个解决方案 word to check or wordlis
在 PhotoImage 下调整图像大小

我需要调整图像大小但我想避免使用 PIL 因为我无法使其在 OS X 下工作不要问我为什么无论如何因为我对 gif pgm ppm 感到满意所以 PhotoImage 类对我来说没问题 photoImg PhotoImage fi
当我从本地计算机更改为虚拟主机时，从 python 脚本调用 pdftotext 不起作用

我编写了一个小的 python 脚本来解析提取 PDF 中的信息我在本地机器上测试了它我有 python 2 6 2 和 pdftotext 版本 0 12 4 我正在尝试在我的虚拟主机服务器 dreamhost 上运行它它有 py
获取 int() 参数必须是字符串或数字，而不是“Column”- Apache Spark

如果我使用以下代码我会收到此异常 int argument must be a string or a number not Column df df withColumn FY F when df ID substr 5 2 isin
dask apply：AttributeError：“DataFrame”对象没有属性“name”

我有一个参数数据框并对每一行应用一个函数该函数本质上是几个 sql queries 和对结果的简单计算我正在尝试利用 Dask 的多处理同时保持结构和界面下面的例子有效并且确实有显着的提升 def get metrics row
Pandas如何按时间段过滤DataFrame

我有一个包含下表的文件 Name AvailableDate totalRemaining 0 X3321 2018 03 14 13 00 00 200 1 X3321 2018 03 14 14 00 00 200 2 X3321 20
无法在我的程序中使用 matplotlib 函数

我正在 Windows 10 中运行 Anaconda 安装 conda 版本 4 3 8 这是我尝试在 python 命令行中运行的代码 import matplotlib pyplot as plt x 1 2 3 4 y 5 6 7
导入目录下的所有模块

有没有办法导入当前目录中的所有模块并返回它们的列表例如对于包含以下内容的目录 mod py mod2 py mod3 py 它会给你
如何全局安装 Python（开发）依赖项，以便我不必在每个 venv 中重新安装它们？

我希望在为每个项目创建的每个 venv 虚拟环境中都可以使用一些 Python 依赖项例如 black flake8 和 pytest 这可能吗如果可以如何实现我想安装这三个once在我的主要 Python 安装下我必须在启动新
更新 matplotlib 中颜色条的范围

我想更新一个contourf在函数内绘制效果很好然而数据的范围发生了变化因此我还必须更新颜色条这就是我未能做到的地方请参阅以下最小工作示例 import matplotlib pyplot as plt import numpy
RuntimeError(f"目录 '{directory}' 不存在") RuntimeError: 目录 'app/static' 不存在

当我运行 server py 文件时出现错误 File C Users nawin AppData Local Programs Python Python38 lib site packages starlette staticfiles
使用 Sphinx 时，如何记录没有文档字符串的成员？

我正在为我发布的包编写文档我发现您的文档越全面人们就越容易找到您的包来使用废话实际上我在充满爱心地编写代码的所有功能和细节方面获得了很多乐趣然而我对如何为类级变量编写与 Sphinx 兼容的文档感到完全困惑特别是我有一些e
如何使用logging.conf文件使用RotatingFileHandler将所有内容记录到文件中？

我正在尝试使用RotatingHandler用于 Python 中的日志记录目的我将备份文件保留为 500 个这意味着我猜它将创建最多 500 个文件并且我设置的大小是 2000 字节不确定建议的大小限制是多少如果我运行下面的代码
Python matplotlib：将轴标签/图例从粗体更改为常规粗细

我正在尝试制作一些出版质量的图但遇到了一个小问题默认情况下 matplotlib 轴标签和图例条目的权重似乎比轴刻度线重是否有办法强制轴标签图例条目与刻度线的重量相同 import matplotlib pyplot as plt
在 anaconda 环境下运行 qsub

我有一个程序通常在 Linux 的 conda 环境中运行因为我用它来管理我的库指令如下 source activate my environment python hello world py 我怎样才能跑你好世界 py在与 PBS
如何在supervisord中设置组？

因此我正在设置 Supervisord 并尝试控制多个进程并且一切正常现在我想设置一个组以便我可以启动停止不同的进程集而不是全部或全无这是我的配置文件的片段 group tapjoy programs tapjoy game1
python 日志记录替代方案 [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案蟒蛇记录模块 http docs python org library logging html使用起来
如何在 Qt 中以编程方式制作一条水平线

我想弄清楚如何在 Qt 中制作一条水平线这很容易在设计器中创建但我想以编程方式创建一个我已经做了一些谷歌搜索并查看了 ui 文件中的 xml 但无法弄清楚任何内容 ui 文件中的 xml 如下所示
用 Beautiful Soup 进行抓取：为什么 get_text 方法不返回该元素的文本？

最近我一直在用 python 开发一个项目其中涉及抓取一些网站的一些代理我遇到的问题是当我尝试抓取某个知名代理站点时当我要求 Beautiful Soup 查找 IP 在代理表中的位置时它并没有按照我的预期执行操作我将尝试查找每

随机推荐

如何获取Jupyter Notebook的路径？

有没有获取Notebook路径的函数我在谷歌上搜索了一些关于这个主题的信息但没有找到一个简单的方法我想获得笔记本的路径这样我就可以在其他地方使用它这样我就可以在与笔记本相同的路径中保存使用文件而不必担心它的保存位置现在我的解
如何在没有机器人的情况下在node.js中接收我自己的电报消息

我想在nodejs 一个例子中有一个非常简单的客户端它可以接收来自我的电报联系人的消息我刚刚在互联网上搜索但只得到了机器人样本我想接收群组消息但我无权向我的机器人授予权限因此我想知道我是否可以在没有机器人作为中介的情况下接收自
将 pandas 中一个时间序列的值替换为另一个时间序列的值

我有两个数据框 s1 time X1 0 1234567000 96 32 1 1234567005 96 01 2 1234567009 96 05 s2 time X2 0 1234566999 23 88 1 1234567006 2
rmarkdown 表的单个单元格中的多行

我想使用 RMarkdown 创建一个在单个单元格中包含多行的表格本页提到了多行和网格表格单元格 http rmarkdown rstudio com authoring pandoc markdown html http rmarkdo
从长到宽的数据。熊猫

我试图将我的数据框从长格式其中有一列带有分类变量转换为宽格式其中每个类别都有自己的价格列目前我的数据如下所示 date time date vendor payment type price 03 10 15 10 00 00 0
JavaScript 确认弹出窗口

我是 javascript 和 web 开发的新手现在我正在 codeigniter 中进行实验我想在删除链接上设置一个 javascript 确认框现在我用这个让它工作得相当好和这个 echo a href a
为什么 Elastic Cloud 部署中存在 Logstash 实例？

我正在调查 Elastic Cloud 托管的 ELK 堆栈 https www elastic co cloud elasticsearch service https www elastic co cloud elasticsearch
将 PIL 图像转换为字节数组

在 C 中我可以使用Bitmap lockbits 以字节数组形式访问位图如何在 PIL 中执行此操作我努力了Image write 但它将完整格式的图像写入流中 from io import BytesIO from PIL imp
当值为 None 或空字符串时排序 python

我有一个包含字典的列表其中我根据不同的值对它们进行排序我用这些代码行来做到这一点 def orderBy self col dir objlist if dir asc sorted objects sorted objlist key
无法加载文件或程序集“System.Web.Optimization，Version=1.0.0.0，Culture=neutral，PublicKeyToken=31bf3856ad364e35”

尽管我已经安装了 Microsoft AspNet Web Optimization 的 nuget 包但我不断收到此错误无法加载文件或程序集 System Web Optimization 版本 1 0 0 0 文化中性 Publi
Bitbucket 管道部署到 gCloud AppEngine 导致 [13] 发生内部错误

我正在尝试在我的项目中使用 bitbucket 管道我用的是Nodejs 当我跑步时gcloud app deploy从 Mac 或 Windows 手动工作正常部署成功完成但从 bitbucket 管道中它失败了错误响应 13 发
关于数据框警告切片的 pandas 副本的混淆

我已经浏览了一系列与此问题相关的问题和答案但我仍然发现我在意想不到的地方收到了切片警告的副本此外它突然出现在我之前运行良好的代码中让我想知道是否某种更新可能是罪魁祸首例如这是一组代码我所做的就是将 Excel 文件读入 pan
函数声明“sub function($$)”是什么意思？

我使用 Perl 一段时间了但今天我遇到了这段代码 sub function1 snip 这在 Perl 中意味着什么它是一个带有原型 http perldoc perl org perlsub html Prototypes这需要两个
Internet Explorer 7 中的 CSS 下拉菜单爆炸

我正在创建一个带有下拉菜单的设计一切都在现代浏览器即 Firefox Chrome Opera Safari 和 IE9 中运行良好但是由于使用 IE7 和 IE8 的访问者数量较多我还需要使菜单与这些版本的 Internet E
如何在使用 angularjs 更新控制器中的新数据之前销毁莫里斯图表数据？

我正在使用 angularjs 根据所选项目加载图表如果我选择第一个项目我将在控制器功能中获取详细信息并显示它当我选择下一个项目时图形加载但第一个选定项目的详细信息不会被破坏如果我选择 4 个项目则显示 4 次图形如何清除
DDD：我真的需要加载聚合中的所有对象吗？（性能问题）

在 DDD 中存储库加载整个聚合我们要么加载全部要么不加载这也意味着应该避免延迟加载我关心的是性能方面的问题如果这导致将数千个对象加载到内存中怎么办例如聚合Customer一万回来Orders 在这种情况下是否意味着我需要
.vimrc：第 4 行：意外标记“(”附近的语法错误[重复]

这个问题在这里已经有答案了我正在尝试配置 Vim 但是当我尝试获取来源时 vimrc编辑文件后出现以下错误源 vimrc bash let g plug shallow 0 未找到命令 bash Users stevenaguilar
Nodemon 错误：“已达到文件观察器数量的系统限制”

我在学GraphQL https en wikipedia org wiki GraphQL我正在使用prisma binding用于 GraphQL 操作我正面临着这个nodemon当我启动 Node js 服务器时出现错误它给了我由
如何“chartr”“-”（或转义范围）？

在 R 中可以使用chartr将字符从一种更改为另一种例如 chartr aor u Stackoverflow 1 Stuck ve fl w 模式可以是范围例如chartr a hwo 0 9 Stackoverflow 但长度需要
鸢尾花数据集未显示“物种”列

我正在 Python 上使用 numpy 和 pandas 来学习如何处理数据帧我正在 Collaboratory 上编码并且已加载 Iris 数据集但由于某种原因我的数据框中没有物种列也许我以错误的方式加载了它我很乐意就此

鸢尾花数据集未显示“物种”列

鸢尾花数据集未显示“物种”列 的相关文章

随机推荐

热门标签

鸢尾花数据集未显示“物种”列的相关文章