在合并的 csv 文件中添加附加列

2024-04-29

我的代码合并 csv 文件并使用 pandas 删除重复项。是否可以向单个合并文件添加带有值的附加标头？

应该调用附加标头Host Alias并且应该对应于Host Name

E.g. Host Name is dpc01n1以及相应的Host Alias应该dev_dom1 Host Name is dpc02n1以及相应的Host Alias应该dev_dom2 etc.

这是我的代码

from glob import glob
import pandas as pd

class bcolors:
    HEADER = '\033[95m'
    OKBLUE = '\033[94m'
    OKGREEN = '\033[92m'
    WARNING = '\033[93m'
    FAIL = '\033[91m'
    ENDC = '\033[0m'
    BOLD = '\033[1m'
    UNDERLINE = '\033[4m'

input_path = r'C:\Users\urale\Desktop\logs'
output_path = r'C:\Users\urale\Desktop\logs' + '\\'
output_name = 'output.csv'

stock_files = sorted(glob(input_path + '\pc_dblatmonstat_*_*.log'))
print(bcolors.OKBLUE + 'Getting .log files from', input_path)

final_headers = [
        'Start Time', 
        'epoch', 
        'Host Name', 
        'Db Alias', 
        'Database', 
        'Db Host', 
        'Db Host IP',
        'IP Port',
        'Latency (us)'
]

#read in files via list comprehension
content = [pd.read_csv(f,usecols = final_headers, sep='[;]',engine='python') 
           for f in stock_files]
print(bcolors.OKBLUE + 'Reading files')


#combine files into one dataframe
combo = pd.concat(content,ignore_index = True)
print(bcolors.OKBLUE + 'Combining files')

#drop duplicates
combo = combo.drop_duplicates()
#combo = combo.drop_duplicates(final_headers, keep=False)
print(bcolors.OKBLUE + 'Dropping duplicates')

#write to csv:
combo.to_csv(output_path + output_name, index = False)
print(bcolors.OKGREEN + 'Merged file output to', output_path, 'as', output_name)

def func(row):
    if row['Host Name'] == "dpc01n1":
        return 'dev_dom1'
    #do your Host Alias generate logic here,and return

combo["Host Alias"]=combo.apply(func, axis=1)

DataFrame.apply 接受一个函数来生成新的 Series 或 DataFrame

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.apply.html https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.apply.html

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

csv

在合并的 csv 文件中添加附加列的相关文章

高效地将大型 Pandas 数据帧写入磁盘

我正在尝试找到使用 Python Pandas 高效地将大型数据帧 250MB 写入磁盘或从磁盘写入的最佳方法我已经尝试了所有方法Python 数据分析但表现却非常令人失望这是一个更大项目的一部分该项目探索将我们当前的分析数据管理
如何使用我自己的自定义表单覆盖 django-rest-auth 中的表单？

我正在使用 django rest auth 并尝试通过覆盖表单的方法之一来修复密码重置视图中的错误尽管我已经使用不同的 django rest auth 表单成功完成了类似的操作但我无法让它在这个表单上工作无论我做什么都会使用旧的
如何检索分配给 Django 中的组的所有权限

我正在执行一项任务来检索分配给 Django 中的组的一组权限我可以使用以下代码获取创建的组但无法使用它来获取分配给它们的权限 from django contrib auth models import Group Permissio
在 PhotoImage 下调整图像大小

我需要调整图像大小但我想避免使用 PIL 因为我无法使其在 OS X 下工作不要问我为什么无论如何因为我对 gif pgm ppm 感到满意所以 PhotoImage 类对我来说没问题 photoImg PhotoImage fi
Python 中 time.sleep 和多线程的问题

我对 python 中的 time sleep 函数有疑问我正在运行一个脚本需要等待另一个程序生成 txt 文件虽然这是一台非常旧的机器所以当我休眠 python 脚本时我遇到了其他程序不生成文件的问题除了使用 time sl
如何将 numpy rearray 的子集转换为连续数组？

我有一个recarray来自读取 csv 文件我有兴趣将列的子集转换为连续浮点数组我想避免将它们转换为列表或将它们一一堆叠我尝试了中的建议https stackoverflow com a 11792956 https stackov
烧瓶 - 404 未找到

我是烧瓶开发的新手这是我在烧瓶中的第一个程序但它向我显示了这个错误在服务器上找不到请求的 URL 如果您输入了网址请手动检查拼写并重试这是我的代码 from flask import Flask app Flask name ap
Karasuba算法递归过多

我正在尝试用 c 实现 Karasuba 乘法算法但现在我只是想让它在 python 中工作这是我的代码 def mult x y b m if max x y lt b return x y bm pow b m x0 x bm x1
无法在我的程序中使用 matplotlib 函数

我正在 Windows 10 中运行 Anaconda 安装 conda 版本 4 3 8 这是我尝试在 python 命令行中运行的代码 import matplotlib pyplot as plt x 1 2 3 4 y 5 6 7
Python：“直接”调用方法是否实例化对象？

我是 Python 新手在对我的对象进行单元测试时我注意到一些奇怪的东西 class Ape object def init self print ooook def say self s print s def main Ape
将 Python Selenium 输出写入 Excel

我编写了一个脚本来从在线网站上抓取产品信息目标是将这些信息写入 Excel 文件由于我的Python知识有限我只知道如何在Powershell中使用Out file导出但结果是每个产品的信息都打印在不同的行上我希望每种产品都有一条
操作错误：尝试在 ubuntu 服务器中写入只读数据库

我正在使用 FlaskApp 运行mod wsgi and apache2在 Ubuntu 服务器上我尝试运行烧瓶应用程序localhost成功然后部署到ubuntu服务器上但是当我尝试更新数据库时出现错误 Failed to up
如何在 Python 中跟踪日志文件？

我想在 Python 中提供 tail F 或类似内容的输出而无需阻塞或锁定我找到了一些非常旧的代码来做到这一点here http code activestate com recipes 436477 filetailpy 但我认为现
无法将matplotlib安装到pycharm

我最近开始使用Python速成课程学习Python编程我陷入困境因为我无法让 matplotlib 在 pycharm 中工作我已经安装了pip 我已经通过命令提示符使用 pip 安装了 matplotlib 现在当我打开 pych
使用 Sphinx 时，如何记录没有文档字符串的成员？

我正在为我发布的包编写文档我发现您的文档越全面人们就越容易找到您的包来使用废话实际上我在充满爱心地编写代码的所有功能和细节方面获得了很多乐趣然而我对如何为类级变量编写与 Sphinx 兼容的文档感到完全困惑特别是我有一些e
在不同的 GPU 上同时训练多个 keras/tensorflow 模型

我想在 Jupyter Notebook 中同时在多个 GPU 上训练多个模型我正在使用 4GPU 的节点上工作我想将一个 GPU 分配给一个模型并同时训练 4 个不同的模型现在我通过例如为一台笔记本选择 GPU import
避免“散点/点/蜂群”图中的数据点重叠

使用绘制点图时matplotlib 我想偏移重叠的数据点以使它们全部可见例如如果我有 CategoryA 0 0 3 0 5 CategoryB 5 10 5 5 10 我想要每一个CategoryA 0 数据点并排设置而不是彼此重叠
旧版本的 spaCy 在尝试安装模型时抛出“KeyError: 'package'”错误

我在 Ubuntu 14 04 4 LTS x64 上使用 spaCy 1 6 0 和 python3 5 为了安装 spaCy 的英文版本我尝试运行这给了我错误消息 ubun ner 3 NeuroNER master src pyt
使用 Numpy 进行多维批量图像卷积

在图像处理和分类网络中一个常见的任务是输入图像与一些固定滤波器的卷积或互相关例如在卷积神经网络 CNN 中这是一种极其常见的操作我已将通用版本任务减少为 Given 一批 N 个图像 N H W D 和一组 K 个滤镜 K H W
用 Beautiful Soup 进行抓取：为什么 get_text 方法不返回该元素的文本？

最近我一直在用 python 开发一个项目其中涉及抓取一些网站的一些代理我遇到的问题是当我尝试抓取某个知名代理站点时当我要求 Beautiful Soup 查找 IP 在代理表中的位置时它并没有按照我的预期执行操作我将尝试查找每

随机推荐

将 Ruby 程序作为 Windows 服务运行？

是否可以将 ruby 应用程序作为 Windows 服务运行我看到有一个相关的问题讨论运行Java 应用程序作为 Windows 服务 https stackoverflow com questions 25530 best method
如何在android中使用Ontouchevent突出显示此pdf页面

这里我想使用android中的onTouchevent来突出显示这段文字您可以使用 OnTouchListener 来获取事件的 x 和 y 然后将屏幕绘制为位图并根据字母的左上角显示和字母的大小使用bitmap getPixel 看看
WSO2 API 管理器 - 我可以隐藏公共商店中的租户商店吗？

是否可以隐藏租户商店以便它们在公共商店中不可见而只能通过其直接租户特定商店 URL 可见例如 https api mydomain com store tenant mycustomer com https api mydomain
struct{} 和 struct{}{} 在 Go 中如何工作？

我想知道 Go 中的 struct 和 struct 是什么意思示例如下 array index struct or make map type struct struct is a keyword https golang org re
根据设备宽度使用 CSS 更改 div 顺序

我正在开发一个响应式网站遇到了一个有趣的问题我有一些并排的 div 可能有 2 到 6 个左右当屏幕不够宽而无法正确显示所有内容时 div 会垂直堆叠使用 CSS 就足够简单了问题是我需要它们根据布局采用不同的顺序这很容易用
Android viewpager：添加/删除页面时出现奇怪的错误

我不知道如何解释所以我上传了一个视频Youtube http www youtube com watch v o5sn31IX Gc当我添加页面时一切正常如果我从列表末尾开始并逐渐移至第一页则删除页面也有效但如果我删除 0 端之间的
如何使用复选框以交互方式过滤 visNetwork 中的节点/边？（使用R闪亮）

使用 Shiny 和 visNetwork R 包我创建了一个交互式网络可视化我希望用户能够通过使用用户界面中的复选框来删除添加节点和边我设法让它部分工作但不知何故当过滤多个项目时我的解决方案不起作用可以查看我试图实现的行为的
如何在 Android Studio 中构建“发布”APK？

我正在尝试构建一个可以上传到 Play 商店的 APK 当我在 Android Studio 版本 0 3 1 中选择 Build Generate Signed APK 时我会被定向到有关如何在 gradle build 脚本中正确设
关闭所有 React Native 输入上的 autoCapitalize (iOS)

我的大部分输入仅在 iOS 上自动大写我知道有自动大写 https facebook github io react native docs textinput html autocapitalize我可以在每个输入上将其设置为 fals
如何使用 PHP 读写编辑 pptx/docx/xlsx 文件？

是否有库扩展可用于使用 PHP 有效处理 pptx docx xlsx 文件到目前为止我对 PPTX 文件更感兴趣据我所知这些文件格式 docx xlsx pptx 只是 zip 文件它们属于 Office Open XML OO
Java-将文件复制到新文件或现有文件

我想写一个函数副本文件f1 文件f2 f1 始终是一个文件 f2 是文件或目录如果 f2 是一个目录我想将 f1 复制到该目录文件名应保持不变如果f2是一个文件我想将f1的内容复制到文件f2的末尾例如如果 F2 具有内容 2
iOS中保存到照片库后获取UIImage数据

将我的应用程序创建的图像保存到 iPhone 库并尝试将其恢复后我遇到了问题图像数据不同创建图像 1 Code 我在不使用 alpha 的情况下创建图像事实上如果我使用 alpha 我会得到相同的结果 UIImage create
既然 Angular 是双向数据绑定，为什么我应该在 Angular 中使用 Redux？

据我了解 Redux 主要是为了在 javascript 应用程序中启用双向数据绑定这对于非双向数据绑定的框架非常有用例如 React 但为什么要在 Angular 中使用它因为它本身就是双向数据绑定的为了说明我的问题我在本机 A
Angular：在 agGrid 中的动态列上设置默认排序的最佳方法

我正在开发 agGrid 我们没有明确定义列我一生都无法弄清楚如何在我的一列上设置默认排序在初始化时我们这样做 public ngOnInit void this gridOptions defaultColDef this selec
Chimpjs 和 Meteor：不使用 Velocity 的测试中的方法调用

此应用程序显示了使用 Cucumber 测试 Meteor 的示例 https github com mhurwi cucumber meteor tutorial https github com mhurwi cucumber mete
在java中迭代集合时从集合中删除项目

我希望能够在迭代集合时从集合中删除多个元素最初我希望迭代器足够聪明能够让下面的简单解决方案发挥作用 Set
NvCplGetThermalSettings 返回 false

问题您好我正在尝试使用 Delphi 获取 nividia gtx 980 的 GPU 温度我看过C 问题他的解决方案是不使用nvcpl dll 我认为这不是正确的解决方案因为 nivida 有完整的文档说明如何处理 API 见下
Vue - API 调用属于 Vuex 吗？

我正在努力寻找在 vue 模块中理想的 API 调用位置的答案我不是在构建 SPA 例如我的 auth 块有几个用于登录密码重置帐户验证等的组件每个块都使用 axios 进行 API 调用 Axios 已经提供了异步的 Promi
使 Primefaces 的数据表行在行版本上无效

我正在使用 JSF 2 1 Primefaces 5 1 开发一个网络应用程序我有一个带有行版本的数据表每行有 2inputText 2 selectOneMenu and 1 selectBooleanCheckbox 我想在单击复选
在合并的 csv 文件中添加附加列

我的代码合并 csv 文件并使用 pandas 删除重复项是否可以向单个合并文件添加带有值的附加标头应该调用附加标头Host Alias并且应该对应于Host Name E g Host Name is dpc01n1以及相应的Host

在合并的 csv 文件中添加附加列

在合并的 csv 文件中添加附加列 的相关文章

随机推荐

热门标签

在合并的 csv 文件中添加附加列的相关文章