Python“数组索引太多”

2024-02-19

我正在使用 pandas 读取 python 中的文件，然后将其保存在 numpy 数组中。该文件的尺寸为 11303402 行 x 10 列。我需要拆分数据以进行交叉验证，为此我将数据切片为 11303402 行 x 9 列的示例和 1 个 11303402 行 x 1 列标签的数组。以下是代码：

tdata=pd.read_csv('train.csv')
tdata.columns='Arrival_Time','Creation_Time','x','y','z','User','Model','Device','sensor','gt']

User_Data = np.array(tdata)
features = User_Data[:,0:9]
labels = User_Data[:,9:10]

错误出现在以下代码中：

classes=np.unique(labels)
idx=labels==classes[0]
Yt=labels[idx]
Xt=features[idx,:]

在线上：

Xt=features[idx,:]

它说“数组索引太多”

所有 3 个数据集的形状为：

print np.shape(tdata) = (11303402, 10)
print np.shape(features) = (11303402, 9)
print np.shape(labels) = (11303402, 1)

如果有人知道这个问题，请帮忙。

问题是idx有形状(11303402,1)因为逻辑比较返回与以下形状相同的数组labels。这两个维度使用了所有的索引features。快速解决方法是

Xt=features[idx[:,0],:]

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

NumPy

Python“数组索引太多” 的相关文章

为什么我不能导入 geopandas？

我唯一的代码行是 import geopandas 它给了我错误 OSError Could not find libspatialindex c library file 以前有人遇到过这个吗我的脚本运行得很好直到出现此错误请注意
如何在 Ubuntu 上安装 Python 模块

我刚刚用Python写了一个函数然后我想将其做成模块并安装在我的 Ubuntu 11 04 上这就是我所做的创建 setup py 和 function py 文件使用 Python2 7 setup py sdist 构建分发文
使用 Django 的 post_save() 信号

我有两张桌子 class Advertisement models Model created at models DateTimeField auto now add True author email models EmailField
如何将条目中的部分文本加粗并更改其背景颜色？

我正在创建一个基于 Tkinter 的 GUI 它有一个 Entry 小部件我想将其文本的一部分加粗并更改其背景颜色但我不知道我该怎么做如果我使用文本小部件我可以只使用标签但看起来它们不能与条目小部件一起使用此代码使用文本小部件
NLTK、搭配问题：需要解包的值太多（预期为 2）

我尝试使用 NLTK 检索搭配但出现错误我使用内置的古腾堡语料库 I wrote alice nltk corpus gutenberg fileids 7 al nltk corpus gutenberg words alice al
Python：当前目录是否自动包含在路径中？

Python 3 4 通过阅读其他一些 SO 问题似乎如果moduleName py文件位于当前目录之外如果要导入它必须将其添加到路径中sys path insert 0 path to application app folder
Python：随时接受用户输入

我正在创建一个可以做很多事情的单元其中之一是计算机器的周期虽然我将把它转移到梯形逻辑 CoDeSys 但我首先将我的想法放入 Python 中我将进行计数只需一个简单的操作 counter 1 print counter 跟踪我处于
反加入熊猫

我有两个表我想附加它们以便仅保留表 A 中的所有数据并且仅在其键唯一时添加表 B 中的数据键值在表 A 和 B 中是唯一的但在某些情况下键将出现在表 A 和 B 中我认为执行此操作的方法将涉及某种过滤联接反联接以获取表 B
我可以使用 dask 创建 multivariate_normal 矩阵吗？

有点相关这个帖子 https stackoverflow com questions 52337612 random multivariate normal on a dask array 我正在尝试复制multivariate norma
负整数的Python表示

gt gt gt x 4 gt gt gt print b format x x 4 100 gt gt gt mask 0xFFFFFFFF gt gt gt print b format x mask x mask 4294967292
ValueError：无法插入 ID，已存在

我有这个数据 ID TIME 1 2 1 4 1 2 2 3 我想按以下方式对数据进行分组ID并计算每组的平均时间和规模 ID MEAN TIME COUNT 1 2 67 3 2 3 00 1 如果我运行此代码则会收到错误 ValueE
在pycharm中调试python代码

这个问题类似于this https stackoverflow com questions 10240018 how to use pycharm to debug python script一我正在尝试调试pyethapp https
使用 lambda 函数更改属性值

我可以使用 lambda 函数循环遍历类对象列表并更改属性值对于所有对象或满足特定条件的对象吗 class Student object def init self name age self name name self age ag
Plotly：如何避免巨大的 html 文件大小

我有一个 3D 装箱模型它使用绘图来绘制输出图我注意到绘制了 600 个项目生成 html 文件需要很长时间文件大小为 89M 这太疯狂了我怀疑可能存在一些巨大的重复或者是由单个项目的 add trace 方法引起的阴谋为
Python模块单元测试的最佳文件结构组织？

遗憾的是我发现有太多方法可以在 Python 中保存单元测试而且它们通常没有很好的文档记录我正在寻找一种终极结构它可以满足以下大部分要求 be discoverable by test frameworks including
如何在单独的文件中使用 FastAPI Depends 作为端点/路由？

我在单独的文件中定义了一个 Websocket 端点例如 from starlette endpoints import WebSocketEndpoint from connection service import Connectio
PyQt 中的线程和信号问题

我在 PyQt 中的线程之间进行通信时遇到一些问题我使用信号在两个线程发送者和监听者之间进行通信发送者发送消息期望被监听者接收但是没有收到任何消息谁能建议可能出了什么问题我确信这一定很简单但我已经环顾了几个小时但没有发现
使用 Keras 和 fit_generator 绘制 TensorBoard 分布和直方图

我正在使用 Keras 使用 fit generator 函数训练 CNN 这似乎是一个已知问题 https github com fchollet keras issues 3358TensorBoard 在此设置中不显示直方图和分布有
将此 MATLAB 代码转换为 Python 时我做错了什么？

我正在努力将生成波形的 MATLAB 代码转换为 Python 就上下文而言这是原子力显微镜带激发响应的模拟与代码错误无关在 MATLAB 中从 r vec 生成的图形与我在 Python 中生成的图形不同我是否正确地将 MATLA
使用 numpy 加速 for 循环

下一个 for 循环如何使用 numpy 获得加速我想这里可以使用一些奇特的索引技巧但我不知道是哪一个这里可以使用 einsum 吗 a 0 for i in range len b a numpy mean C d e f b i

随机推荐

计算 Pandas 中每组中第一个事件的第 n 天

这是来自的后续问题我的另一个问题 https stackoverflow com questions 13156660 compute the nth day from the first event in pandas 我有以下数据框从
无法从 Git 中递归删除文件

我想从 Git 中删除 bin 中的所有文件 I run git rm r cached vim Thanks to Pate in finding cached I get fatal pathspec vim colors did no
Java int 零前缀？ [复制]

这个问题在这里已经有答案了可能的重复带前导零的整数 https stackoverflow com questions 565634 integer with leading zeroes Hi Java 如何处理以零为前缀的字节整数
如何将 Kotlin PSI 源文件添加到 IDEA Plugin 项目配置中

我正在尝试为 IDEA 插件之一添加对 kotlin 的支持到目前为止我发现了这个page https intellij support jetbrains com hc en us community posts 1150007248
如何使用 Swift 检索通讯录联系人？

我不明白为什么我的代码不能用 Swift 编译我正在尝试转换这个 Objective C 代码 CFErrorRef error NULL ABAddressBookRef addressBook ABAddressBookCreateW
WPF 将窗口标题绑定到 ViewModel 属性

我正在尝试将窗口标题绑定到具有 Title 属性的 ViewModel 下面是主窗口 XAML
如何设置Android按钮背景颜色？

我想为几个按钮使用自定义背景颜色我试过android background cc2 但它取代了整个按钮因此它看起来不再像一个按钮显然可以使用
HTTP是无状态的，那么keep-alive是什么意思呢？

Keep Alive 300 Proxy Connection keep alive 我们知道HTTP连接在请求得到响应时关闭那么这是什么意思keep alive 有人可以详细说明一下吗这意味着可以保持连接打开以请求更多资源例如图像和
DDD：从哪里获取值对象列表最合适

我有一个分配给产品的名为产品类型的值类型一种产品有一种产品类型为了允许用户从列表中选择类型我将填充一个下拉列表在哪里检索产品类型列表最合适实现存储库模式的类编辑通过将产品代码更改为产品类型来澄清产品类型类似于 DVD C
PostgreSQL 9.2：citext[] 上的 GIN 索引

我需要加快这个查询的速度 SELECT FROM mytable WHERE value ANY citext array col LIMIT 1 where citext array col是一个 citext 数组我尝试创建一个运算符
为什么我的 Django 视图在每个页面视图中都会被点击两次？

我似乎一辈子都找不到问题所在非常简单我有一个从数据库中提取的数据库对象将其视图增加一然后保存我的视图显示增加的值但随后我的日志显示该值再次增加 g Game objects filter slug slug distinct
将dataUrl转换为blob并通过ajax提交

我正在使用 imgly 图像裁剪器插件针对我的应用程序稍作修改它当前将图像转换为dataUrl并将图像输出为 base64 图像我可以将其另存为 jpeg 我正在努力调整dataURItoBlob找到函数here https stac
无法打开文档“Main.Storyboard”。无法识别的文件内容

从 Xcode 7 更新到 Xcode 8 后我无法打开 Storyboard 有人可以帮忙吗里面没有显示任何错误对于我来说将故事板打开为源代码修复合并冲突然后重新启动 Xcode 就完成了这项工作
使用 PHP 将二进制数据插入 SQL Server

我在 SQL Server 2005 数据库中有一个 varbinary MAX 字段我试图弄清楚如何使用 PHP 将二进制数据即图像插入到该字段中我使用 ODBC 连接 SQL Server 数据库我已经看到许多示例解释了如何与
Qt平台插件问题Rstudio

我正在尝试通过 RStudio 绘制 seaborn 热图 I usereticulateR 中的包下面是我的代码 library reticulate use condaenv python36 conda auto required
如何用CLOB调用REPLACE（不超过32K）

Oracle 11g 确实提高了 CLOB 的可用性重载了大多数字符串函数因此它们现在可以与 CLOB 一起本地工作然而一位同事从他的代码中得到了这个错误 ORA 22828 input pattern or replacement
如何对 django url 进行单元测试？

除了我的应用程序之外我的应用程序在所有地方都实现了 100 的测试覆盖率urls py 你对我如何写作有什么建议吗有意义的对我的 URL 进行单元测试 FWIW 这个问题是在我尝试测试驱动开发时出现的并且希望在编写代码来修复它们之前失败
如何通过已知路由器上的三角测量来确定我的位置？

有没有可用的开源软件基本上我只想根据位置固定且已知的路由器的信号强度进行三角测量我意识到可能存在干扰的情况但我们还是坚持列出已知的源代码谢谢我不知道任何三边测量软件有人应该编写一个开源库看看三边测量 http en wiki
错误 NETSDK1064：找不到软件包 DnsClient，1.2.0

我有一个 Asp Net core docker 镜像我上次尝试构建它是两个月前现在我在尝试构建它时遇到错误有任何想法吗是不是有什么东西破坏了 Microsoft docker 镜像当尝试在 Elasticbeanstalk 实
Python“数组索引太多”

我正在使用 pandas 读取 python 中的文件然后将其保存在 numpy 数组中该文件的尺寸为 11303402 行 x 10 列我需要拆分数据以进行交叉验证为此我将数据切片为 11303402 行 x 9 列的示例和 1

Python“数组索引太多”

Python“数组索引太多” 的相关文章

随机推荐

热门标签