创建 Pandas 数据框,并将列表作为行中的值

2024-01-09

如何按以下格式创建 pandas 数据框:

      A            B            C             D
0    [1,2,3,4]    [2,3,4,5]     [4,5,5,6]     [6,3,4,5]
1    [2,3,5,6]    [3,4,6,6]     [3,4,5,7]     [2,6,3,4]
2    [8,9,6,7]    [5,7,9,5]     [3,7,9,5]     [5,7,9,8]

基本上每一行都有一个列表作为元素。我正在尝试使用机器学习对数据进行分类。每个数据点都有 40 x 6 个值。是否有任何其他格式适合输入分类器。

Edit:

import pandas as pd
import numpy as np
import matplotlib.pyplot as plot

from sklearn.neighbors import KNeighborsClassifier

# Read csv data into pandas data frame
data_frame = pd.read_csv('data.csv')

extract_columns = ['LinearAccX', 'LinearAccY', 'LinearAccZ', 'Roll', 'pitch', 'compass']

# Number of sample in one shot
samples_per_shot = 40

# Calculate number of shots in dataframe
count_of_shots = len(data_frame.index)/samples_per_shot

# Initialize Empty data frame
training_index = range(count_of_shots)
training_data_list = []

# flag for backward compatibility
make_old_data_compatible_with_new = 0

if make_old_data_compatible_with_new:
    # Convert 40 shot data to 25 shot data
    # New logic takes 25 samples/shot
    # old logic takes 40 samples/shot
    start_shot_sample_index = 9
    end_shot_sample_index = 34
else:
    # Start index from 1 and continue till lets say 40
    start_shot_sample_index = 1
    end_shot_sample_index = samples_per_shot

# Extract each shot into pandas series
for shot in range(count_of_shots):
    # Extract current shot
    current_shot_data = data_frame[data_frame['shot_no']==(shot+1)]

    # Select only the following column
    selected_columns_from_shot = current_shot_data[extract_columns]

    # Select columns from selected rows
    # Find start and end row indexes
    current_shot_data_start_index = shot * samples_per_shot + start_shot_sample_index
    current_shot_data_end_index = shot * samples_per_shot + end_shot_sample_index
    selected_rows_from_shot = selected_columns_from_shot.ix[current_shot_data_start_index:current_shot_data_end_index]

# Append to list of lists
# Convert selected short into multi-dimensional array
training_data_list.append([selected_columns_from_shot[extract_columns[index]].values.tolist() for index in range(len(extract_c    olumns))])

# Append each sliced shot into training data
training_data = pd.DataFrame(training_data_list, columns=extract_columns)
training_features = [1 for i in range(count_of_shots)]
knn = KNeighborsClassifier(n_neighbors=3)
knn.fit(training_data, training_features)

simple

pd.DataFrame(
    [[[1, 2, 3, 4], [2, 3, 4, 5], [4, 5, 5, 6], [6, 3, 4, 5]],
     [[2, 3, 5, 6], [3, 4, 6, 6], [3, 4, 5, 7], [2, 6, 3, 4]],
     [[8, 9, 6, 7], [5, 7, 9, 5], [3, 7, 9, 5], [5, 7, 9, 8]]],
    columns=list('ABCD')
)

Or

build a Series with a MultiIndex and unstack

lst = [
    [1, 2, 3, 4],
    [2, 3, 4, 5],
    [4, 5, 5, 6],
    [6, 3, 4, 5],
    [2, 3, 5, 6],
    [3, 4, 6, 6],
    [3, 4, 5, 7],
    [2, 6, 3, 4],
    [8, 9, 6, 7],
    [5, 7, 9, 5],
    [3, 7, 9, 5],
    [5, 7, 9, 8]]

pd.Series(lst, pd.MultiIndex.from_product([[0, 1, 2], list('ABCD')])).unstack()

              A             B             C             D
0  [1, 2, 3, 4]  [2, 3, 4, 5]  [4, 5, 5, 6]  [6, 3, 4, 5]
1  [2, 3, 5, 6]  [3, 4, 6, 6]  [3, 4, 5, 7]  [2, 6, 3, 4]
2  [8, 9, 6, 7]  [5, 7, 9, 5]  [3, 7, 9, 5]  [5, 7, 9, 8]
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

创建 Pandas 数据框,并将列表作为行中的值 的相关文章

随机推荐

  • C# 列表和枚举器的属性

    我有以下问题 我有一个列表并将字符串项目添加到该列表中 然后我从列表中创建一个枚举器 当我用循环遍历列表时MoveNext 当我直接访问枚举器时 它会起作用 当我使用枚举器属性访问枚举器时 它不起作用 这MoveNext 命令不会增加索引
  • 将 OpenCV 与 Django 结合使用

    我想在我的 Django 应用程序中使用 OpenCV 由于 OpenCV 是一个库 我认为我们可以像任何其他库一样使用它 当我尝试使用导入它时import cv2在 Django 的视图中 它工作正常 但是当我尝试在 Django 视图中
  • 页面顶部固定浮动 div 中的 Bootstrap 警报

    我有一个使用 Bootstrap 的 Web 应用程序 2 3 2 公司政策 如果不对多个 Web 应用程序进行大量测试 我们就无法升级到 3 0 我们在此应用程序中有几个长页面需要验证表单和表格 然而 由于实用和美观的原因 我们需要在页面
  • 为什么 stripe Checkout 中没有帐单地址

    我正在使用 Stripe Checkout 进行信用卡收费 但我在弹出窗口中没有看到帐单地址 为什么他们不需要帐单地址 为什么 当我准备使用信用卡付款时 我访问的任何其他网站都会要求提供帐单地址 Stripe Checkout 中已弃用帐单
  • 以字符串形式访问对象属性并设置其值

    我有一个实例Account班级 每个帐户对象都有一个所有者 引用等 我访问帐户属性的一种方法是通过访问器 例如 account Reference 但我希望能够使用动态字符串选择器访问它 例如 account PropertyName 就像
  • 读取某些元素名称中包含“-”的 XML 提要

    我正在尝试读取元素名称中包含 的 xml feed 可以在此处找到源 我是 php 新手 所以我可能会忽略一些基本的东西 我正在使用 SimpleXML 来读取提要 这是我用来解决我的问题的一些基本代码 我阅读了预测和最低温度 没有任何问题
  • 基于 DateTime 创建自定义 GroupDescription

    我正在对一些数据进行分组 PropertyGroupDescription 在大多数情况下都工作正常 但是 如果该属性是 DateTime 并且我不想将多个日期分组为一组 例如每组 30 天或其他 我将需要一个新的 GroupDescrip
  • 字节码操作模式

    字节码操作有哪些合法用途以及人们如何在实践中实现这些基于字节码操作的解决方案 Update 我应该更清楚地表明 这个问题实际上是关于人们使用什么模式和技术在字节码操作的帮助下使他们的代码飞起来 像已经提到的面向方面的编程或动态构建代理对象和
  • 如何使用 Python 从出站 Twilio 呼叫中检索信息?

    我是 Twilio 的新手 正在尝试弄清楚如何从我使用 Python 3 成功拨打的出站呼叫中检索数据 我希望能够检索诸如收件人按下的按钮之类的信息 在阅读了一点 Twilio 文档 然后有点迷失 后 我想我了解了 Twilio 的工作原理
  • @Viewchild看不到matSort

    在我的 Angular 应用程序中 我的 ViewChild 实例无法填充 HTL matSort 我的组件 ts import MatSort from angular material export class MyClassCompo
  • 卤素键盘输入示例和取消订阅事件?

    如何取消订阅除 HandleKey 之外的其他操作的键盘事件键盘输入示例 https github com slamdata purescript halogen blob master examples keyboard input sr
  • 缓冲区溢出 - 普通用户中的 SegFaults

    下面是我的代码 包括易受攻击的程序 stack c 和我的漏洞利用程序 exploit c 这段代码适用于教授为 Windows 用户发送的预打包 Ubuntu 9 我有一个朋友在他的计算机上测试了它 但在我在 iMac 上运行的 Ubun
  • 如何从 Android 设备访问本地 REST api?

    我的计算机上本地运行着一个 spring REST api 我想使用这个 api 进行 android 开发 这是我的获取请求 public static String sendGet final String url StringBuil
  • 是否可以通过动态 LINQ 进行注入?

    使用动态 LINQ 库 link http weblogs asp net scottgu archive 2008 01 07 dynamic linq part 1 using the linq dynamic query librar
  • jquery文档主体一键事件

    有人可以帮我解决这个问题吗 我有一个按钮 单击它会显示某个 div 这个 div 有几个后代 现在 我想要的是 当我单击文档中的其他位置时 但在这些后代中却没有这个div消失了 我的想法是使用 not 选择器 如下所示 button cli
  • Spark中“RDD可以存储在内存中”是什么意思?

    Spark的介绍中说 RDD 可以在查询之间存储在内存中 无需复制 http spark apache org research html 据我所知 您必须使用手动缓存 RDD cache or persist 如果我不采取任何措施 如下所
  • Windows subprocess.Popen 不带 shell=True 的批处理文件

    我有一个运行的函数lessc 安装有npm install g less gt gt gt import subprocess gt gt gt subprocess Popen lessc Traceback most recent ca
  • 在打开的 Windows 资源管理器中选择一个文件

    我有以下代码 它将启动 Windows 资源管理器并选择一个文件并最大化资源管理器 然后它将查找 Windows 资源管理器并将其最小化 我做了最大化 最小化 这样我就不必手动执行此操作 我知道很懒 我在代码中设置了此设置 仅在文件夹未打开
  • JavaScript 倒计时器:计算距离美国东部标准时间午夜还有多少秒

    我正在使用在 JavaScript 中运行的 24 小时倒计时器 目前 它使用秒作为其基本测量单位 我在这里列出了 86400 但我想计算每天到午夜 东部标准时间 5 还剩多少秒 有人可以演示我如何定义该值并将其插入 时间 变量吗 我已经看
  • 创建 Pandas 数据框,并将列表作为行中的值

    如何按以下格式创建 pandas 数据框 A B C D 0 1 2 3 4 2 3 4 5 4 5 5 6 6 3 4 5 1 2 3 5 6 3 4 6 6 3 4 5 7 2 6 3 4 2 8 9 6 7 5 7 9 5 3 7 9