Pandas 在 train_test_split 返回的数据上“不再支持将列表之类传递给 .loc 或带有任何缺失标签的 []”

2024-01-02

由于某种原因，train_test_split 尽管长度相同且索引看起来相同，但仍会触发此错误。

from sklearn.model_selection import KFold

data = {'col1':[30.5,45,1,99,6,5,4,2,5,7,7,3], 'col2':[99.5, 98, 95, 90,1,5,6,7,4,4,3,3],'col3':[23, 23.6, 3, 90,1,9,60,9,7,2,2,1]} 
df = pd.DataFrame(data)

train, test = train_test_split(df, test_size=0.10)
X = train[['col1', 'col2']]
y2 = train['col3']

X = np.array(X)

kf = KFold(n_splits=3, shuffle=True)
for train_index, test_index in kf.split(X):
    X_train, y_train = X[train_index], y[train_index]

y 是 pandas 系列（与 x 长度相同）。 x 是一个数据框，约有 20 个数字列转换为 numpy 数组。

由于某种原因，尽管长度相同，train_test_split 仍会触发错误。

如果我不调用 train_test_split 它工作正常。

由于尝试以这种方式索引 numpy 数组，最后一行触发了错误： y[train_ind]

我尝试为您的情况创建一个场景。

我创建了以下数据框：

    col1  col2  col3
0      1     2     1
1      3     4     0
2      5     6     1
3      7     8     0
4      9    10     1
5     11    12     0
6     13    14     1
7     15    16     0
8     17    18     1
9     19    20     0
10    21    22     1
11    23    24     0
12    25    26     1
13    27    28     0
14    29    30     1

I set col1 and col2对于 X 和col3对于 y。之后我将 X 转换为 numpy 数组，如下所示。唯一的区别是我用过shuffle in KFold.

X = df[['col1', 'col2']]
y = df['col3']
X = np.array(X)
kf = KFold(n_splits=3, shuffle=True)
for train_index, test_index in kf.split(X):
    X_train, y_train = X[train_index], y[train_index]

而且效果很好。因此，请检查我的代码和您的代码，并澄清是否有我遗漏的内容。

Update

我假设 y2 是 y。所以 y 类型仍然是Series，你需要使用.iloc为了它。以下代码运行良好。

data = {'col1':[30.5,45,1,99,6,5,4,2,5,7,7,3], 'col2':[99.5, 98, 95, 90,1,5,6,7,4,4,3,3],'col3':[23, 23.6, 3, 90,1,9,60,9,7,2,2,1]}
df = pd.DataFrame(data)
train, test = train_test_split(df, test_size=0.10)

X = train[['col1', 'col2']]
y = train['col3']

X = np.array(X)

kf = KFold(n_splits=3, shuffle=True)
for train_index, test_index in kf.split(X):
    X_train, y_train = X[train_index], y.iloc[train_index]

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

NumPy

scikitlearn

Pandas 在 train_test_split 返回的数据上“不再支持将列表之类传递给 .loc 或带有任何缺失标签的 []” 的相关文章

Paramiko - 使用私钥连接 - 不是有效的 OPENSSH 私钥/公钥文件

我正在尝试找到解决方案但无法理解我做错了什么在我的 Linux 服务器上我运行了以下命令 ssh keygen t rsa 这产生了一个id rsa and id rsa pub file 然后我将它们复制到本地并尝试运行以下代码 s
Pandas重置索引未生效[重复]

这个问题在这里已经有答案了我不确定我在哪里误入歧途但我似乎无法重置数据帧上的索引当我跑步时test head 我得到以下输出正如您所看到的数据帧是一个切片因此索引超出范围我想做的是重置该数据帧的索引所以我跑test rese
如何限制Django CreateView中ForeignKey字段的选择？

我有一个沿着这些思路的模型结构 models py class Foo models Model class Bar models Model foo models ForeignKey Foo class Baz models Model
“char”/“character”类型的类型提示

char 或 character 没有内置的原始类型因此显然必须使用长度为 1 的字符串但是为了暗示这一点并暗示它应该被视为一个字符如何通过类型提示来实现这一点 grade chr A 一种方法可能是使用内置的 chr 函数来表示这一
Python Kivy - 在本机网络浏览器中打开 url 的应用程序

我尝试制作一个简单的应用程序在单击 Screen One 上的按钮后在 Kivy 中打开一个网页我使用了这个主题 Python 在应用程序中直接显示网络浏览器 iframe https stackoverflow com questi
如何在 Python 中将彩色输出打印到终端？

是否有与 Perl 等效的 Python 语言 print color red print
如何在python中检索aws批处理参数值？

流程 Dynamo DB gt Lambda gt 批处理如果将角色 arn 插入动态数据库它是从 lambda 事件中检索的然后使用submit job角色 arn 的 API 被传递为 parameters role arn ar
更改 pandas 中多个日期时间列的时区信息

有没有一种简单的方法可以将数据帧中的所有时间戳列转换为本地任何时区不是逐列进行吗您可以有选择地将转换应用于所有日期时间列首先选择它们select dtypes https pandas pydata org pandas docs
如何列出 python PDB 中的当前行？

在 perl 调试器中如果重复列出离开当前行的代码段可以通过输入命令返回到当前行点我无法使用 python PDB 模块找到任何类似的东西如果我list如果我自己离开当前行并想再次查看它似乎我必须记住当前正在执行的行号对我来说
将一个列表的元素除以另一个列表的元素

我有两个清单比如说 a 10 20 30 40 50 60 b 30 70 110 正如你所看到的列表 b 由一个列表的元素总和组成其中 window 2 b 0 a 0 a 1 10 20 30 etc 如何获得另一个列表该列表由
如何有效地从 loadmat 函数生成的嵌套 numpy 数组中提取值？

python中是否有更有效的方法从嵌套的python列表中提取数据例如A array array 12000000 dtype object 我一直在使用A 0 0 0 0 当你有很多像 A 这样的数据时这似乎不是一个有效的方法我也用
在 MacO 和 Linux 上安装 win32com [重复]

这个问题在这里已经有答案了我的问题很简单我可以安装吗win32com蟒蛇API pywin32特别是在非 Windows 操作系统上我一直在Mac上尝试多个版本pip install pywin32 都失败了下面是一个例子如果你
导入错误：没有名为 google.auth 的模块

当我尝试导入时firebase admin in python 2 7我收到错误导入错误没有名为 google auth 的模块这是Docker文件 https github com ammaratef45 Attendance bl
查找给定节点的最高权重边

我在 NetworkX 中有一个有向图边缘的权重从 0 到 1 表示它们发生的概率网络连通性非常高所以我想修剪每个节点的边缘只保留最高概率的节点我不确定如何迭代每个节点并仅保留最高权重in edges在图中有没有一个networ
如何通过字符串匹配加速 pandas 行过滤？

我经常需要过滤 pandas 数据框df by df df col name string value 并且我想加快行选择操作有没有快速的方法可以做到这一点例如 In 1 df mul df 3000 2000 3 reset inde
Flask WTForms 使用变量自动填充 StringField

我有一个表格我想用上一页收到的信息自动填充一些字段但如果他们想调整它它需要是可更改的我正在为我的 SelectField 使用动态创建的列表但添加 StringField 并不成功请参阅下面的我的代码 forms py clas
为什么实现 __iter__ 的对象不被识别为可迭代的？

假设您使用包装对象 class IterOrNotIter def init self self f open tmp toto txt def getattr self item try return self getattribute
全局变量是 None 而不是实例 - Python

我正在处理Python 中的全局变量代码应该可以正常工作但是有一个问题我必须使用全局变量作为类的实例Back 当我运行应用程序时它说 back is None 这应该不是真的因为第二行setup 功能 back Back Back
如何在sphinx中启用数学？

我在用sphinx http sphinx pocoo org index html与pngmath http sphinx pocoo org ext math html module sphinx ext pngmath扩展来记录我的代
异步和协程与任务队列

我一直在阅读有关 python 3 中的 asyncio 模块的内容以及更广泛地了解 python 中的协程的内容但我不明白是什么让 asyncio 成为如此出色的工具我的感觉是你可以用协程做的所有事情通过使用基于多处理模块例如

随机推荐

在 TensorFlow 中合并字符串张量

我和很多人一起工作dtype str 数据我一直在尝试构建一个简单的图表如下所示https www tensorflow org versions master api docs python train html SummaryWri
当 http 标头中未设置 Accept-Ranges 时，浏览器音频播放失败；为什么？

我最近在 Firefox 或 Chrome 中打开音频文件时发现了一些事情令我惊讶如果我不指定 HTTP 响应标头 Accept Ranges bytes 则 Firefox 将无法在播放结束之前确定 ogg 文件的长度以秒为单位 C
Flexbox 与同一容器内的图像和文本对齐

我正在制作 Flexbox 员工 ID 卡布局员工的照片将显示在左侧员工信息姓名员工 ID 部门等将以列表格式从上到下显示在图像的右侧我需要使用弹性盒来做到这一点这是我的 JSFiddle 的链接其中包含我迄今为止所做的事情
向对等方发送 Hyperledger Fabric 的链码实例化请求时出现 OCI 运行时错误

将 Hyperledger Fabric Java SDK 与 GO 链代码结合使用在尝试使用以下命令启动链代码后出现错误channel sendInstantiationProposal instantiateProposalReque
是否可以以编程方式启动/停止 IIS 中的应用程序池或网站？

我正在尝试找到一种方法来从同一服务器上的 Web 界面内停止启动重新启动回收网站和应用程序池理想情况下这将是我可以使用 NET 完成的事情而无需执行 shell 命令我看到有人提出了其他相关问题但我不想从命令行执行此操作除
Powershell批量查询外部DNS服务器以获取各种类型的记录？

我有一个我拥有的域名列表需要更多信息下面的脚本非常适合通过内部 Windows DNS 服务器进行查询如何修改它以使用外部 DNS 服务器如 1 1 1 1 或 8 8 8 8 outFile C Temp DnsRecords c
Android WebView 导航事件？

我正在寻找相当于 WPF WebBrowser 的 Navigating 事件或 IOS UiWebView 的 ShouldStartLoad 事件的 Android WebView 事件我找到了 shouldOverrideUrlLo
代码执行期间报告信息：最佳设计

在设计正确的执行报告时我总是心存疑虑假设您有以下情况简单来说很愚蠢我将使用Python def doStuff doStep1 doStep2 doStep3 现在假设您想要提供各个步骤的报告如果出现问题等不是真正的调试只
确定 blob 是否是图像而不加载整个字段？

有没有办法从数据库中的 BLOB 类型字段中仅读取几个字节对于这个问题数据库品牌无关紧要并确定二进制内容是否是图像假设它是以下之一 JPG GIF PNG 我有一个将文件存储在数据库中的网络应用程序如果它是图像我想显示缩略图否
隐式异步自定义验证器（采用 2 个参数的自定义验证器）在 mongoose >= 4.9.0 中已弃用

我正在使用猫鼬4 9 0 虽然下面的代码有效但我收到如下警告节点 24769 DeprecationWarning 隐式异步自定义验证器接受 2 个参数的自定义验证器在 mongoose gt 4 9 0 中已弃用看http mo
如何在 Internet Explorer 8 或更早版本上查找我创建的网页？ [复制]

这个问题在这里已经有答案了我使用的是 windows7 它仅支持 Internet Explorer 9 我在 Chrome 浏览器上设计网页但您知道 Enternet Explorer 8 或更早版本不支持某些 CSS 功能但是当我
Jest 无法从导入的类创建对象

In 更改Factory test js我正在导入我想测试的类如下所示 import ChangesFactory from path to src ChangesFactory 我正在尝试在测试用例中创建一个实例如下所示 descri
设置 PostgreSQL 实例的时区

我正在使用最新的 Zend 框架与 PostgreSQL 数据库进行通信我的一些数据库表有一个now 添加当前时间戳的字段但是对于不同的请求数据库连接的时区可能不同是否可以为每个连接设置 PostgreSQL 数据库的时区我知道
OpenNLP: documentBuilderFactory.setFeature("http://javax.xml.XMLConstants/feature/secure-processing", true) ParserConfigurationE

所以我尝试在 Android Studio 中使用 OpenNLP 但我的应用程序总是抛出ParserConfigurationException在 OpenNLP 在其 XmlUtil 类中使用的代码体内我无法修改该代码 public
如何创建类型提示以表明我返回的列表包含字符串？

我想在我的 Python 程序中使用类型提示如何为复杂的数据结构创建类型提示例如带字符串的列表返回整数的生成器 Example def names gt list I would like to specify that the l
UICollectionView 单元格在点击时更改背景

是否可以更改背景颜色UICollectionView仅当元素被点击时我努力了 void collectionView UICollectionView collectionView didHighlightItemAtIndexPath
MongoDB中如何设置自增主键？ [复制]

这个问题在这里已经有答案了 MongoDB中如何设置自增主键通常 MongoDB 会生成 ObjectID 我想使用我自己的自动增量主键例如MySQL 示例将不胜感激我在这里写了一篇博客 http www alexjamesbrown
如何填写空的提交消息？

直到一分钟前我有一个 Git 存储库其中最后一次提交有一条空的提交消息我通过将新的提交压缩到它上面来填充它git rebase i 无论如何我都打算修改内容但我仍然想知道是否有正确的方法来填写空的提交消息 I tried git c
将独立对象添加到 RealmList

是否可以将独立对象添加到已保存在领域中的 RealmObject 的 RealmList 中好吧我知道这不起作用因为我在 object row getIndex RealmList 94 我想做的是 mRealm beginTrans
Pandas 在 train_test_split 返回的数据上“不再支持将列表之类传递给 .loc 或带有任何缺失标签的 []”

由于某种原因 train test split 尽管长度相同且索引看起来相同但仍会触发此错误 from sklearn model selection import KFold data col1 30 5 45 1 99 6 5 4 2

Pandas 在 train_test_split 返回的数据上“不再支持将列表之类传递给 .loc 或带有任何缺失标签的 []”

Update

Pandas 在 train_test_split 返回的数据上“不再支持将列表之类传递给 .loc 或带有任何缺失标签的 []” 的相关文章

随机推荐

热门标签