自动检测/转换数据类型?

2023-12-07

numpy中是否有一个函数可以确定字符串应该是整数还是浮点数并自动转换它们?例如,我经常有一个记录集合,这些记录是使用以下组合从文本文件中解析出来的:str.strip() and str.split()。然后我得到类似的东西

List = [['1','a','.3'],
        ['2','b','-.5']]

然后使用转换numpy.rec.fromrecords:

In [1227]: numpy.rec.fromrecords(List)
Out[1227]: 
rec.array([('1', 'a', '.3'), ('2', 'b', '-.5')], 
      dtype=[('f0', '|S1'), ('f1', '|S1'), ('f2', '|S3')])

在R中,有一个函数叫做type.convert字符串的向量/列被传递到哪个,它将确定该列的类型应该是什么(即,如果它是字符串和数字的混合,它将仍然是字符向量)。 Excel 也这样做(基于它的前 6 个元素,如果我没记错的话)...

NumPy/Python中有这样的函数吗?我知道我可能可以编写一个函数来测试列的每个元素是否可以转换为整数等,但是有内置的东西吗?我知道在所有示例中,处方都是明确指定数据类型,但我想跳过这一步。谢谢。


numpy.genfromtxt如果您设置,可以猜测 dtypesdtype=None:

import numpy as np
import io

alist = [['1','a','.3'],
        ['2','b','-.5']]

f = io.BytesIO('\n'.join(' '.join(row) for row in alist))
arr = np.genfromtxt(f,dtype=None)
print(arr)
print(arr.dtype)
# [(1, 'a', 0.3) (2, 'b', -0.5)]
# [('f0', '<i4'), ('f1', '|S1'), ('f2', '<f8')]

请注意,最好申请np.genfromtxt直接到您的文本文件,而不是创建中间列表List(或者我所说的alist)。如果您需要在将文件发送到之前对其进行一些处理np.genfromtxt,你可以做一个类似文件的对象包装器围绕可以进行处理并传递给的文件np.genfromtxt.

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

自动检测/转换数据类型? 的相关文章

  • 当语料库有100亿个独特的DNA序列时,如何使用BK树实现快速模糊搜索引擎?

    我正在尝试使用BK tree https news ycombinator com item id 14022424python 中的数据结构 用于存储约 100 亿个条目的语料库 1e10 以实现快速模糊搜索引擎 一旦我添加超过 1000
  • 将数字转换为整数列表[重复]

    这个问题在这里已经有答案了 我该如何写magic下面的函数 gt gt gt num 123 gt gt gt lst magic num gt gt gt gt gt gt print lst type lst 1 2 3
  • 如果每个区域内至少有 5 个连续行,如何在每个标题区域的末尾使用 Title[Name]2 发布新行?

    我想在每个 Title 区域的末尾使用 Title Name 2 发布新行的最简单方法是通过一个计算连续行数的变量 其中至少有 5 个连续行包含 1 1 1 1在每个 标题区域内 我不确定我对计数变量做错了什么 也许 确实必须在每个 Tit
  • 将 2D Panda 的 DataFrame 列表转换为 3D DataFrame

    我正在尝试创建一个将标签值保存到 2D DataFrame 的 Pandas DataFrame 这是我到目前为止所做的 我正在使用读取 csv 文件pd read csv并将它们附加到列表中 出于这个问题的目的 让我们考虑以下代码 imp
  • Tensorflow 训练期间 GPU 使用率非常低

    我正在尝试为 10 类图像分类任务训练一个简单的多层感知器 这是 Udacity 深度学习课程作业的一部分 更准确地说 任务是对各种字体呈现的字母进行分类 数据集称为 notMNIST 我最终得到的代码看起来相当简单 但无论如何我在训练期间
  • self.__dict__.update(**kwargs) 的风格是好是坏?

    在 Python 中 假设我有一些类 Circle 它继承自 Shape Shape 需要 x 和 y 坐标 此外 Circle 需要半径 我希望能够通过执行类似的操作来初始化 Circle c Circle x 1 y 5 r 3 Cir
  • Python 中嵌套列表的排序和分组

    我有以下数据结构 列表的列表 4 21 1 14 2008 10 24 15 42 58 3 22 4 2somename 2008 10 24 15 22 03 5 21 3 19 2008 10 24 15 45 45 6 21 1 1
  • Pygooglevoice登录错误

    另一个人问了这个问题 但没有回复 所以我再问一遍 我正在尝试使用 pygooglevoice API 但是当我运行 SMS py 示例脚本时 它给了我一个登录错误 我已经安装了 Enthought python 我想也许我还需要安装其他东西
  • 如何从 Python 3.5 降级到 3.4

    我想安装 kivy 链接在这里 https kivy org docs installation installation windows html install win dist 用于项目 但是 当尝试使用 pip 安装它所依赖的包时
  • t /= d 是什么意思? Python 和错误

    t current time b begInnIng value c change In value d duration def easeOutQuad swing function x t b c d alert jQuery easi
  • 自适应支付 API 错误 580001

    我正在 python 中向 paypal 自适应支付 API 发出 PAY 请求 并收到通用错误 id 580001 没有其他信息 headers API credentials for the API caller business ac
  • Python itertools groupby 中令人不安的奇怪行为/错误?

    我在用itertools groupby解析一个短的制表符分隔的文本文件 文本文件有几列 我想做的就是对具有特定值的所有条目进行分组x在特定的列中 下面的代码对名为的列执行此操作name2 寻找变量中的值x 我尝试使用以下方法来做到这一点c
  • 如何连接多个字符串? [复制]

    这个问题在这里已经有答案了 如何将 stringList 中的所有字符串合并为一个而不打印它 例如 s joinStrings very hot day returns string print s Veryhotday 感觉有点倒退 但是
  • 如何在 matplotlib 中第一个 x 轴的底部添加第二个 x 轴?

    我指的是已经提出的问题here https stackoverflow com questions 10514315 how to add a second x axis in matplotlib 在此示例中 用户通过将第二个轴添加到与标
  • 返回吃异常

    我至少发现了以下行为weird def errors try ErrorErrorError finally return 10 print errors prints 10 It should raise NameError name E
  • 如何使用 PyAudio 选择特定的输入设备

    通过 PyAudio 录制音频时 如何指定要使用的确切输入设备 我的电脑有两个麦克风 一个内置 一个通过 USB 我想使用 USB 麦克风进行录音 这流类 https people csail mit edu hubert pyaudio
  • 如何从 IDLE 命令行运行 Python 脚本?

    在 bash shell 中 我可以使用 bash 或 source 手动调用脚本 我可以在 Python IDLE 的交互式 shell 中做类似的事情吗 我知道我可以转到文件 gt gt 打开模块 然后在单独的窗口中运行它 但这很麻烦
  • 在 Python 中伪造一个对象是否是类的实例

    假设我有一堂课FakePerson它模仿基类的所有属性和功能RealPerson 不扩展它 在Python 3中 是否可以伪造isinstance 为了认识到FakePerson as a RealPerson只通过修改对象FakePers
  • python 相当于 sed

    有没有一种方法 无需双循环即可完成以下 sed 命令的操作 Input Time Banana spinach turkey sed i Banana s Toothpaste file Output Time BananaToothpas
  • 混合两个列表的Pythonic方法[重复]

    这个问题在这里已经有答案了 我有两个长度为 n 和 n 1 的列表 a 1 a 2 a n b 1 b 2 b n 1 我想要一个函数作为结果给出一个列表 其中包含两个中的替代元素 即 b 1 a 1 b n a n b n 1 以下方法有

随机推荐

  • 将 ObservableCollection 设置为 ObservableProperty

    我要切换到CommunityToolkit Mvvm源生成器来处理我的视图模型 我对如何处理有点困惑ObservableCollections 我的视图模型如下所示 public partial class MyViewModel Obse
  • 将字符字段更改为日期

    我有一个遗留的 postgres 数据库 其日期列转换为character 50 字段 不要问 我想更改表格和列以包含实际日期 因为这有效 select distinct to date date begin YYYY DD MM from
  • 如何动态实现api版本控制和swagger文档

    我正在 dotnet core api 工作 我必须在 api 上实现版本控制 swagger文档应该按api版本分类 在 Net Core api 版本控制中 可以通过添加来自 nuget 的以下参考来实现 Microsoft AspNe
  • MYSQL 缺少第一行数据[重复]

    这个问题在这里已经有答案了 我编写了一个 PHP 脚本 其中返回餐厅名称 地址 电话号码 营业时间表和自定义菜单的链接 但是 即使数据库中有周一的条目 当我在 mysqli fetch assoc 中执行 while 循环时 它也不会显示
  • Powershell:如何将一个 CSV 中的唯一标头合并到另一个 CSV 中?

    Edit 1 因此 我已经弄清楚如何获取 CSV 2 中的唯一标头以附加到 CSV 1 header table Get Member MemberType NoteProperty Name header add table add Ge
  • MVP 到 MVVM Android

    这里的一个人告诉我 MVVM 比 MVP 更好 他告诉了我很多优点和很多优点 但我想知道我的 MVP 是否做得很好 或者您是否知道任何其他可能转换为 MVVM 的方法 这是使用 Google MVP 登录 我不会放置所有代码 但我会放置文件
  • C# 鼠标悬停时改变表格行颜色

    我的 winform 中有一个表格布局面板 我想在鼠标悬停在一行时向行添加效果 我想我需要在表格上进行 Mouse over 操作 然后检测表格的行号 然后迭代该行上的每个单元格并更改其背景颜色 问题是我不知道如何获取行号 有什么想法吗 E
  • cer、pvk 和 pfx 文件之间有什么区别?

    cer pvk 和 pfx 文件之间有什么区别 另外 我要保留哪些文件以及我应该将哪些文件提供给我的交易对手 Windows 使用 X 509 证书的 cer 扩展名 这些可以是 二进制 ASN 1 DER 也可以使用 Base 64 进行
  • 使用 AccountManagement 扩展类时如何设置二进制属性?

    我正在使用一个自定义类以在 Active Directory 中公开一些自定义架构 我正在存储一个二进制 blob 根据项目要求 该数据必须存储在 AD 中 我不能使用外部存储 如果可以的话我会这样做 当我创建用户时 它可以很好地存储 bl
  • 在一次调用中检索存储库及其标签版本的列表

    我有两个天蓝色的 CLI 查询 az acr repository list 检索我的容器注册表中的存储库列表 az acr repository show tags 检索第一个查询返回的每个存储库的版本标记 这会导致初始调用来检索列表 然
  • 如何从表单中获取 int 而不是 string?

    从表单获取变量
  • 如何通过JavaScript中的正则表达式将camelCase更改为slug-case(或kebab-case)

    因为某些原因 这个答案我发现 据说 如何在 php 中做到这一点只是给了我错误的匹配 它似乎添加了破折号 但也用字符串其余部分的副本替换了大写字母 所以我希望 abcZxc 变成 abc zxc 但它把它变成 abd zxczxc 这 加上
  • 将第三方 js 文件与 TypeScript 结合使用

    我是 typeScript 的新手 我希望能够使用没有定义文件的第三方库 Typescript 是否允许您使用外部库 我尝试使用的库是 filesaver jshttps github com eligrey FileSaver js 我需
  • 使用 Python 以无密码的用户身份登录 Windows

    我这里有一个情况 使用Python 我创建了一个进程 以系统或管理员用户身份运行 并且我需要使用不同的用户名 无需密码 调用应用程序 因此 阅读下面的链接 结论是可能的 使用 Kerberos 模拟另一个没有密码的用户 但我没有找到任何用
  • Crosswalk 从 JavaScript 调用 Java 方法

    我现在正在走人行横道 当用户单击 HTML 中的按钮时 我需要调用 Java 方法 该方法可能如下所示 a href Start a 我不确定是否人行横道延长线就是我想要的 仅仅为了调用Java函数似乎就很重了 有没有更简单的方法来做到这一
  • 在 SQLite 错误中插入多行(错误代码 = 1)

    在 SQLite Android 中执行以下查询时出现错误 sDataBase execSQL query 插入联系人 ID 名字 姓氏 电话号码 电子邮件 ID 状态 值 ae0caa6a 8ff6 d63f 0253 110b20ac2
  • 如何在具有设定名称的文件夹中列出谷歌驱动器中的所有文件?

    我的驱动器中有一个文件夹 其中包含多个 客户端 文件夹 每个客户端文件夹都具有相同的结构 其中包括一个包含已完成发票 称为 已完成发票 的文件夹 我需要一种方法来遍历所有名为 Completed Invoices 的文件夹 并在 Googl
  • 将 Codeigniter 3 应用于新域名主机会导致 session_files_drive.php 出现 mkdir() 错误

    我有一个 Codeigniter 框架设置 我将其跨多个域设置作为默认起点 它给了我以下错误 当我添加全新安装的 CI3 并添加数据库信息以及以下自动加载时 情况是一样的 autoload libraries array database
  • 理解python中的执行流程

    对于 python 新手 对执行流程感到困惑 为了详细说明 我陈述以下示例 示例1 def hello print hello world python def python print testing main if name main
  • 自动检测/转换数据类型?

    numpy中是否有一个函数可以确定字符串应该是整数还是浮点数并自动转换它们 例如 我经常有一个记录集合 这些记录是使用以下组合从文本文件中解析出来的 str strip and str split 然后我得到类似的东西 List 1 a 3