Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
仅从 tsv 中的列索引生成“特殊”字典结构
想象一下这样一个制表符分隔的文件 9606 1 GO 0002576 TAS platelet degranulation Process 9606 1 GO 0003674 ND molecular function z Function
python
function
csv
Dictionary
categoricaldata
Pandas MultiIndex 按分类顺序自定义排序级别,而不是按字母顺序
我是 Pandas 0 16 1 的新手 并且希望在多索引中进行自定义排序 因此我使用分类 我的多重索引的一部分 Part Defect Own 504 504 504 505 506 507 530 530 530 我创建了具有多索引级别
python
pandas
Sorting
multiindex
categoricaldata
使用 R 中的 ggplot2 在分类散点图中添加水平线
我正在尝试为 3 个组绘制一个简单的散点图 每个组具有不同的水平线 线段 例如 组 a 的 hline 为 3 组 b 的 hline 为 2 5 hline 为组 b c 组为 6 library ggplot2 df lt data f
r
ggplot2
line
categoricaldata
scatter
使用 cut 为时间变量创建 24 个类别
在这里 我导入数据 对其进行一些操作 这可能不是问题 修复所在 前两行设置了我的剪切参数 lab var num lt 0 24 times var lt c 0 100 200 300 400 500 600 700 800 900 10
r
DataFrame
cut
categoricaldata
如何直接使用栅格属性表对栅格进行图例并仅显示栅格中显示的类的图例?
我想使用栅格属性表信息来创建栅格的图例 例如栅格1 https i stack imgur com tgC2P png并仅显示栅格中显示的类的图例 我举了一个例子来解释我想要得到什么 1 构建光栅 r lt raster ncol 10 n
r
Dictionary
legend
Raster
categoricaldata
Scikit-learn 的 LabelBinarizer 与 OneHotEncoder
两者有什么区别 似乎两者都创建了新列 其数量等于特征中唯一类别的数量 然后 他们根据数据点所属的类别将 0 和 1 分配给数据点 下面显示了使用 LabelEncoder OneHotEncoder LabelBinarizer 对数组进行
python
encoding
scikitlearn
datascience
categoricaldata
将 pandas 数据框列映射到字典
我有一个数据框的案例 其中包含高基数的分类变量 许多唯一值 我想将该变量重新编码为一组值 最常见的值 并用一个包罗万象的类别 其他 替换所有其他值 举一个简单的例子 以下是应保持不变的两个值 top values apple orange
python
python3x
pandas
series
categoricaldata
Pandas:分类列和每个类别的行插入
我似乎无法实现插入缺少值的行 同时将一列作为分类 假设以下数据框 df 其中 B 列是分类的 类别应按 d b c a 的顺序出现 df pd DataFrame A i i i j k B pd Categorical d c b b a
python3x
pandas
DataFrame
categoricaldata
使用 groupby 和 Mean() 在 Pandas 中保留一个包含分类变量的列
有没有办法在之后保留分类变量groupby and mean 例如 给定数据框df ratio Metadata A Metadata B treatment 0 54265 937500 B10 1 AB cmpd 01 11 10736
python
pandas
pandasgroupby
categoricaldata
Python 相当于 R 的 cluster 包中的 daisy()
我有一个数据集 其中包含分类 名义和序数 和数字属性 我想使用这些混合属性来计算我的观察结果的 不 相似度矩阵 使用daisy http stat ethz ch R manual R patched library cluster htm
python
r
similarity
categoricaldata
rdaisy
使用“statsmodels”指定将哪个类别视为基础
了解当我将模型中的类别变量传递给statsmodels fit将为类别自动生成虚拟变量 例如 如果我有一个变量 Location 其值为 IndianOcean Thailand China 和 Mars 我将在我的模型中获得以下形式的变量
python
linearregression
StatsModels
categoricaldata
从 pandas 中具有多个值的列创建虚拟对象
我正在寻找一种Python式的方法来处理以下问题 The pandas get dummies 方法非常适合从数据帧的分类列创建虚拟对象 例如 如果该列的值位于 A B get dummies 创建 2 个虚拟变量并相应地分配 0 或 1
python
pandas
dummydata
categoricaldata
词汇分散图是seaborn
我正在使用 seaborn 模块来生成类似于下面示例的图 import pandas as pd import matplotlib pyplot as plt import numpy as np import seaborn as sn
python
pandas
matplotlib
Seaborn
categoricaldata
如何使用深度学习在Python jupyter笔记本中解决这个问题
我正在努力奔跑 但出现这个错误 TypeError int 参数必须是字符串 类似字节的对象或数字 而不是 NoneType 这是代码 data np asarray data dtype float 255 0 labels np arr
python
NumPy
deeplearning
Anaconda
categoricaldata
Plotly.js:无法显示完整的分类 x 轴
我必须绘制一个关于时间的 x 轴折线图 x 轴类似于 00 00 00 05 00 10 23 55 使其不是数字而是分类 但是 我可能没有 y 轴上的完整数据列表 例如 仅从 00 00 到 09 00 有数据 数据必须从 00 00 开
categoricaldata
处理训练和测试数据中的不同因子水平
我有一个 20 列的训练数据集 所有这些都是我必须用于训练模型的因素 我已经获得了测试数据集 我必须在该数据集上应用我的模型进行预测并提交 我正在进行初始数据探索 只是出于好奇检查了训练数据和测试数据级别 因为我们正在处理所有类别变量 令我
r
machinelearning
Classification
RandomForest
categoricaldata
Pandas 将所有对象列转换为类别
我想要一个优雅的函数来将 pandas 数据框中的所有对象列转换为类别 df x df x astype category 执行类型转换df select dtypes include object 将子选择所有类别列 但是 这会导致其他列
python
pandas
casting
categoricaldata
R coxph() 警告:Loglik 在变量之前收敛
我在使用 coxph 时遇到一些问题 我有两个分类变量 性别和可能的原因 我想将其用作预测变量 性别只是典型的男性 女性 但可能的原因有 5 个选项 我不知道警告消息有什么问题 为什么置信区间从 0 到 Inf 并且 p 值如此高 这是代码
r
survivalanalysis
categoricaldata
coxregression
回归分析中的分类特征数据和序数特征数据差异?
在进行回归分析时 我试图完全理解分类数据和序数数据之间的差异 目前 已经明确的是 分类特征和数据示例 颜色 红 白 黑为什么分类 red lt white lt black逻辑上是不正确 序数特征和数据示例 状况 旧的 翻新的 新的为什么序
自动比较小鼠 glm.mids 的嵌套模型
我有一个来自 R 的多重插补模型mice包中有很多因子变量 例如 library mice library Hmisc turn all the variables into factors fake nhanes fake age as
r
ANOVA
categoricaldata
rmice
1
2
3
»