如何在 python 中对 h2o 框架进行子集化。
如果 x 是一个 df 并且 Origin 是一个变量,那么在 pandas 中我们通常可以通过以下方式进行子集化
x[x.Origin == 'AAF']
但使用 h2o 框架会出现以下错误:
“H2OResponseError:服务器错误 java.lang.IllegalArgumentException:
错误:“x.hex”的名称查找失败”
有多种不同的方法可以按行对 H2OFrame 进行切片。 H2O 用户指南中概述了这些方法行切片 http://docs.h2o.ai/h2o/latest-stable/h2o-docs/data-munging/slicing-rows.html.
下面是一个基于使用 Iris 数据集设置为特定值的列来对 H2OFrame 进行子集化的 Python 示例:
import h2o
h2o.init()
# Load data
path = "http://h2o-public-test-data.s3.amazonaws.com/smalldata/iris/iris_wheader.csv"
df = h2o.import_file(path=path)
# Subset data
mask = df["class"] == "Iris-setosa"
newdf = df[mask, :]
# equivalent to both of these, which also work
# newdf = df[df["class"] == "Iris-setosa", :]
# newdf = df[df["class"] == "Iris-setosa"]
The newdf = df[df["class"] == "Iris-setosa"]
版本几乎与上面的格式相同,除了 H2OFrames 不支持引用这样的列:df.class
;你必须使用:df["class"]
.
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)