Pandas - 根据行值生成唯一 ID

2024-04-01

我想为用户生成一个基于整数的唯一 ID（在我的 df 中）。

假设我有：

index  first  last    dob
0      peter  jones   20000101
1      john   doe     19870105
2      adam   smith   19441212
3      john   doe     19870105
4      jenny  fast    19640822

我想生成一个 ID 列，如下所示：

index  first  last    dob       id
0      peter  jones   20000101  1244821450
1      john   doe     19870105  1742118427
2      adam   smith   19441212  1841181386
3      john   doe     19870105  1742118427
4      jenny  fast    19640822  1687411973

10 位数字 ID，但它基于字段的值（约翰·多伊相同的行值获得相同的 ID）。

我研究了哈希、加密、UUID，但找不到与这个特定的非安全用例有太多相关的内容。它只是生成一个内部标识符。

我不能使用 groupby/cat 代码类型方法，以防行发生变化。
数据集的增长不会超过 50k 行。
可以肯定地假设不会有第一个、最后一个重复。

感觉我可能以错误的方式解决这个问题，因为我找不到太多关于它的文献！

Thanks

您可以尝试使用哈希函数。

df['id'] = df[['first', 'last']].sum(axis=1).map(hash)

请注意，哈希 ID 大于 10 位数字，并且是唯一的整数序列。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

Hash

Pandas - 根据行值生成唯一 ID 的相关文章

元组有什么用？

我现在正在学习 Python 课程我们刚刚介绍了元组作为数据类型之一我阅读了它的维基百科页面但是我无法弄清楚这种数据类型在实践中会有什么用处我可以提供一些需要一组不可变数字的示例吗也许是在 Python 中这与列表有何不同每
使用字典映射数据帧索引

为什么不df index map dict 工作就像df column name map dict 这是尝试使用index map的一个小例子 import pandas as pd df pd DataFrame one A 10 B 2
datetime.datetime.now() 返回旧值

我正在通过匹配日期查找 python 中的数据存储条目我想要的是每天选择今天的条目但由于某种原因当我将代码上传到 gae 服务器时它只能工作一天第二天它仍然返回相同的值例如当我上传代码并在 07 01 2014 执行它时它
如何在 Python 中解析和比较 ISO 8601 持续时间？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个 Python v2 库它允许我解析和比较 ISO 8601 持续时间may处于不同单
为什么 PyYAML 花费这么多时间来解析 YAML 文件？

我正在解析一个大约 6500 行的 YAML 文件格式如下 foo1 bar1 blah name john age 123 metadata whatever1 whatever whatever2 whatever stuff thi
从Python中的字典列表中查找特定值

我的字典列表中有以下数据 data I versicolor 0 Sepal Length 7 9 I setosa 0 I virginica 1 I versicolor 0 I setosa 1 I virginica 0 Sepal
Python，将函数的输出重定向到文件中

我正在尝试将函数的输出存储到Python中的文件中我想做的是这样的 def test print This is a Test file open Log a file write test file close 但是当我这样做时我收到
“隐藏”内置类对象、函数、代码等的名称和性质[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我很好奇模块中存在的类builtins无法直接访问的例如 type lambda 0 name function of module
在Python中检索PostgreSQL数据库的新记录

在数据库表中第二列和第三列有数字将会不断添加新行每次每当数据库表中添加新行时 python 都需要不断检查它们当 sql 表中收到的新行数低于 105 时 python 应打印一条通知消息警告数量已降至 105 以下另一方面
如何使用python在一个文件中写入多行

如果我知道要写多少行我就知道如何将多行写入一个文件但是当我想写多行时问题就出现了但是我不知道它们会是多少我正在开发一个应用程序它从网站上抓取并将结果的链接存储在文本文件中但是我们不知道它会回复多少行我的代码现在如下 r
如何通过 TLS 1.2 运行 django runserver

我正在本地 Mac OS X 机器上测试 Stripe 订单我正在实现这段代码 stripe api key settings STRIPE SECRET order stripe Order create currency usd em
Numpy - 根据表示一维的坐标向量的条件替换数组中的值

我有一个data多维数组最后一个是距离另一方面我有距离向量r 例如 Data np ones 20 30 100 r np linspace 10 50 100 最后我还有一个临界距离值列表称为r0 使得 r0 shape Dat
Jupyter Notebook 找不到 Python 模块

不知道发生了什么但每当我使用 ipython 氢原子或 jupyter 笔记本时都找不到任何已安装的模块我知道我安装了 pandas 但笔记本说找不到我应该补充一点当我正常运行脚本时 python script py 它确实导入
仅第一个加载的 Django 站点有效

我最近向 stackoverflow 提交了一个问题标题为使用mod wsgi在apache上多次请求后Django无限加载 https stackoverflow com questions 71705909 django infini
如何在 Windows 命令行中使用参数运行 Python 脚本

这是我的蟒蛇hello py script def hello a b print hello and that s your sum sum a b print sum import sys if name main hello sys
Pandas 将多行列数据帧转换为单行多列数据帧

我的数据框如下 code df Car measurements Before After amb temp 30 268212 26 627491 engine temp 41 812730 39 254255 engine eff 15
如何在 pygtk 中创建新信号

我创建了一个 python 对象但我想在它上面发送信号我让它继承自 gobject GObject 但似乎没有任何方法可以在我的对象上创建新信号您还可以在类定义中定义信号 class MyGObjectClass gobject GO
如何计算Python中字典中最常见的前10个值

我对 python 和一般编程都很陌生所以请友善我正在尝试分析包含音乐信息的 csv 文件并返回最常听的前 n 个乐队从下面的代码中每听一首歌曲都是一个列表中的字典条目格式如下 album Exile on Main Street
在 JavaScript 函数的 Django 模板中转义字符串参数

我有一个 JavaScript 函数它返回一组对象 return Func id name 例如我在传递包含引号的字符串时遇到问题 Dr Seuss ABC BOOk 是无效语法 I tried name safe 但无济于事有什么解
使用随机放置的 NaN 创建示例 numpy 数组

出于测试目的我想创建一个M by Nnumpy 数组与c随机放置的 NaN import numpy as np M 10 N 5 c 15 A np random randn M N A mask np nan 我在创建时遇到问题mas

随机推荐

C# 解析宽松的 json 来制作一棵树

所以我需要解析类似这样的文件 pl GENERIC BACK COFNIJ WAIT CZEKAJ PAGES ABOUTME ID ID INFO STATUS STATUS TOP MENU LOGGED Zalogowany OPTI
PHP CLI - 一段时间后要求用户输入或执行操作

我正在尝试创建一个 PHP 脚本其中我要求用户选择一个选项基本上类似于 echo Type number of your choice below echo 1 Perform Action 1 echo 2 Perform Actio
在 Ember.js 中，存储保存和存储提交之间有什么区别？

有什么区别 this get store commit and this get store save 没有区别 save是一个别名commit与此一起介绍的PR 使 commit 成为 save 的别名 https github com
OpenXML 在写入元素时挂起

我有一个程序它基本上从数据库中提取数据将其缓存到文件中然后将该数据导出为多种格式 Excel Excel 2003 CSV 我正在使用 OpenXML SDK 2 0 来完成 Excel 工作这些导出过程并行运行使用Paralle
如何将世界上所有国家/城市/州放入我的数据库？

我有一个困难的架构和网络问题我正在尝试为世界上每个城市制作一个关于徒步旅行的页面http www comehike com http www comehike com 我必须以某种方式导入世界上所有的城市并按州构建它们而州又按国家构建
FILTER_VALIDATE_URL 是否过于严格？

In PHP filter var www example com FILTER VALIDATE URL 回报false 它是否正确不是www example com有效的 URL 或协议 http ftp 等需要在 URL 中明确说
将 C# 单元测试名称转换为英文（testdox 样式）

我有一大堆用 MbUnit 编写的单元测试我想从测试名称生成简单的英语句子这里介绍一下这个概念 http dannorth net introducing bdd http dannorth net introducing bdd 这是
基于类的vue组件的标签名称是什么

参考下面的链接我们可以使用用 TypeScript 编写的基于类的 vue 组件使用这些自定义组件的正确方法是什么例如下面的 Es5 代码定义了一个可以在其他组件模板中使用的组件例如
带分组的 WPF DataGrid 虚拟化

我正在使用来自 CodePlex 的 WPF DataGrid http wpf codeplex com 我需要让虚拟化与分组一起使用 This question https stackoverflow com questions 110
获取页面事件、选项卡关闭、失去焦点？

问题是如何在特定选项卡上查询此类事件用户已加载具有特定 URL 的选项卡例如 google com 我认为最简单的方法是使用 chrome tabs query 然后您可以获取带有 url 的活动选项卡用户已关闭选项卡该选项卡处于非
是否有任何选项可以禁用开火服务器上的群聊消息历史记录？

我一直在创造group chat application 在实现群聊功能时我面临问题当我每次join the room open fire sends last two days messages 这是我每次加入房间时收到的帖子消息
在页面加载时显示 AJAX 加载器

你好我对 javascript 很陌生不知道如何使用它我希望 AJAX 加载器在页面加载时出现加载完成后我希望加载器消失谁能给我发一个代码吗通常这是通过在内容顶部显示隐藏一两个 div 来完成的您可以从以下位置获取精美的加
Sharepoint 2013。使用 JavaScript 的多值查找字段

有没有办法使用 JavaScript 客户端对象模型编辑多值查找字段我需要删除一个或多个查找值并最终添加一个或多个值我到处搜索我阅读MSDN文档我也看看我的桌子底下 Thanks Multiple Column Lookup值表示
Flutter：在启动时执行函数 - 等待 HTTP 响应解析器提取图像 URL

我正在开发一个 Flutter 应用程序我需要从 API 获取几乎所有内容包括图像颜色文本等所以我应该做的是构建应用程序的主要结构然后用 API 提供的信息填充所有内容当应用程序开始获取响应并初始化变量以在应用程序中使用它们时
C# 和 C++ 类继承混合

我有一堆有趣的程序集想要组合在一起通用汇编 C 或 C CLI public class MyBase public void MethodA private void MethodB protected virtual MethodC
使用 LINQ 从文件中读取文本数据

我有以下文本文件 37 44 60 67 15 94 45 02 44 如何使用 LINQ 从此文件中读取所有数字并将它们保存到二维数组中我所做的就是创建一个简单的数组其中每行中包含所有第一个值在这种情况下使用 LINQ 是个好主意还
如何在 c 中的变量中仅存储文件的结束位

我的代码如下 include
Google API key V2 RuntimeException [关闭]

Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案我创建了一个示例 Android 应用程序用于使用 google api key v2 访问 google 地图当我
在 Haskell 中如何将字符串列表相乘？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我正在尝试编写一个函数该函数接受字符串列表和 Int 并返回其中每个字符串都是 int 次的字符串列表那是 duplicate S
Pandas - 根据行值生成唯一 ID

我想为用户生成一个基于整数的唯一 ID 在我的 df 中假设我有 index first last dob 0 peter jones 20000101 1 john doe 19870105 2 adam smith 19441212

Pandas - 根据行值生成唯一 ID

Pandas - 根据行值生成唯一 ID 的相关文章

随机推荐

热门标签