我一直在为我的博士学位构建一个分析工作流程,并一直使用三重嵌套列表来表示我的数据结构,因为我希望它能够在第二层和第三层扩展到任意数量的数据。第一级是整个数据集,第二级是数据集中的每个主题,第三级是每个主题的每个度量的一行。
[dataset]
|
[subject]
|
[measure1, measure2, measure3]
我正在尝试将函数映射到每个度量 - 例如将所有点转换为浮点数或将异常值替换为 None - 并希望根据其嵌套返回整个数据集,但我当前的代码:
for subject in dataset:
for measure in subject:
map(float, measure)
...结果是正确的并且正是我想要的,但问题是我无法想象如何有效地将结果分配回数据集或在不丢失嵌套级别的情况下。理想情况下,我希望它改变措施*in place但我想不出该怎么做。
你能建议一种高效且Python式的方法吗?三重嵌套列表是在程序中组织数据的愚蠢方法吗?
与其原地踏步,不如制定一个新清单
dataset = [[[float(value) for value in measure]
for measure in subject]
for subject in dataset]
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)