巧用WINRAR和DOS命令处理压缩数据

2023-11-08

开展计算机审计,首先要取得被审计单位的电子数据,然后将数据标准化,即将被审计单位提供的数据转换成便于审计人员使用的 SQL Server 或其他数据库格式的数据。因此,计算机审计首先要解决的是数据标准化问题。  
  许多商业银行采取按天备份的策略,即将每天产生的数据单独备份(多以压缩包形式)。笔者结合计算机审计工作实际经验,给出一种处理压缩数据的通用方法。即通过对 WinRAR 格式的压缩数据进行自动解压缩,然后将每天的单个文本文件通过 DOS 命令合并成大文本文件,以便于对数据的后续处理。  
  一、基础资料  
  需要从某商业银行取得其某年全年的数据,如 2009 1 1 日至 2009 12 31 日的数据备份。该数据备份格式为 WinRAR 格式,存储方式是按天存储,即每个压缩文件中存储的是该行信息系统各表当天产生的数据。  
  二、处理方法  
  (一)利用 WinRAR 的命令行功能处理压缩数据。  
  由于数据是按天存储,解开每个压缩文件就能解压缩出当天各表所有的数据。如果是手工解压缩,即通过双击每个压缩文件来解压缩当天的数据,那一年的数据就要通过 300 多次双击操作才能解压缩完毕,效率低下,容易出现差错,而且浪费时间和精力。  
  利用 WinRAR 的命令行功能,可以将备份数据自动解压缩至指定目录。主要命令如下: “winrar x D:\ 090101-091231\d2009*.tar.Z D:\data2009\”  
  其中 “x” 表示以完整路径解压缩文件和文件夹; “D:\ 090101-091231\d2009*.tar.Z” 则表示压缩文件存储的源路径,用 “d2009*.tar.Z” 代表目录下的所有文件( * 为通配符); “D:\data2009\” 表示解压缩后数据文件存储的路径。  
  具体操作方法:  
  在安装了 WinRAR 软件的 WindowsXP 操作系统中,单击 开始 ,然后单击 运行 ,在对话框中输入 “winrar x D:\ 090101-091231\d2009*.tar.Z D:\data2009\”, 然后单击 确定 ,即弹出 WinRAR 界面,自动进行解压缩。  
   (二)利用 DOS 命令将文本文件合并成大文本文件。  
  由于最终导入 SQL Server 数据库时需要将每个表以单个表的形式导入,因此要将每个表在 300 多天形成的 300 多个小文本文件先按月合并成文本文件,再按年合并成大文本文件。完成对一个表操作命令的编写后,将对所有表的操作命令写成批处理文件,即可自动执行。  
  具体操作方法(以 4 月份数据为例):  
  新建一个文本文档,在文档中编辑如下命令: COPY D:\data2009\20090401\aghfh.txt+D:\data2009\20090402\aghfh.txt+D:\data2009\20090403\aghfh.txt+D:\data2009\20090404\aghfh.txt+D:\data2009\20090405\aghfh.txt+D:\data2009\20090406\aghfh.txt+D:\data2009\20090407\aghfh.txt+D:\data2009\20090408\aghfh.txt+D:\data2009\20090409\aghfh.txt+D:\data2009\20090410\aghfh.txt+D:\data2009\20090411\aghfh.txt+D:\data2009\20090412\aghfh.txt+D:\data2009\20090413\aghfh.txt+D:\data2009\20090414\aghfh.txt+D:\data2009\20090415\aghfh.txt+D:\data2009\20090416\aghfh.txt+D:\data2009\20090417\aghfh.txt+D:\data2009\20090418\aghfh.txt+D:\data2009\20090419\aghfh.txt+D:\data2009\20090420\aghfh.txt+D:\data2009\20090421\aghfh.txt+D:\data2009\20090422\aghfh.txt+D:\data2009\20090423\aghfh.txt+D:\data2009\20090424\aghfh.txt+D:\data2009\20090425\aghfh.txt+D:\data2009\20090426\aghfh.txt+D:\data2009\20090427\aghfh.txt+D:\data2009\20090428\aghfh.txt+D:\data2009\20090429\aghfh.txt+D:\data2009\20090430\aghfh.txt D:\d2009\200904aghfh.txt 
  上述命令将表 “aghfh”2009 4 1 日至 2009 4 30 日产生的数据合并成为一个文本文件,并将其命名为 “200904aghfh.txt” ,存储在 “D:\d2009\” 目录下。依此类推,按照上述模式编写对其他表的合并命令。全部编写完成后,保存该文本文档并关闭。重命名该文本文档,可将其命名为 合并 200904.bat” (必须将扩展名改为 .bat ,将文本文件变为批处理文件),然后双击该文件,弹出 DOS 对话框,开始自动进行按月合并。  
  按相同的办法即可将每月的文本文件合并成按年的大文本文件。  
  在把所有的表合并完成后,即可对标准的文本文件导入审计人员熟悉的数据库软件进行查询和分析。  
  用上述方法处理压缩的文本数据,可大大提高工作效率。(胥雪刚)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

巧用WINRAR和DOS命令处理压缩数据 的相关文章

随机推荐

  • 前端Css@media设备媒体查询大全

    移动端设备 media max width 575px 移动端设备 横屏 低分辨率 media min width 576px and max width 767px iPad 平板设备 and 移动端设备 横屏 高分辨率 media mi
  • utf8转gb2312精简版

    var strGB 啊阿埃挨哎唉哀皑癌蔼矮艾碍爱隘鞍氨安俺按暗岸胺案肮昂盎凹敖熬翱袄傲奥懊澳芭捌扒叭吧笆八疤巴拔跋靶把耙坝霸罢爸白柏百摆佰败拜稗斑班搬扳般颁板版扮拌伴瓣半办绊邦帮梆榜膀绑棒磅蚌镑傍谤苞胞包褒剥薄雹保堡饱宝抱报暴豹鲍爆杯碑悲卑
  • linux强制安装rpm包的命令

    rpm ivh rpm nodeps force 强制安装会忽略掉所有依赖关系 强制进行安装 转载于 https www cnblogs com Noul p 10523090 html
  • 机器学习实战——第四章(分类):朴素贝叶斯

    前言 首先感谢博主 Jack Cui 主页 http blog csdn net c406495762 朴素贝叶斯博文地址 https blog csdn net c406495762 article details 77341116 ht
  • 在Ubuntu上用命令行安装Chrome浏览器

    1 下载谷歌浏览器 通过使用Ctrl Alt T键盘快捷键或单击终端图标来打开终端 使用wget下载最新的Chrome deb软件包 wget https dl google com linux direct google chrome s
  • 小程序自动化测试框架Minium——框架介绍和环境搭建

    一 Minium 简介 minium 是微信团队为小程序专门开发的自动化框架 我们可以用它来做小程序的UI自动化测试 但是它的能力却不仅仅在于UI自动化 正是得益于官方订制打造 所以对于小程序很多原生内容和特性的支持自然也是非常独到的 比如
  • 重点必考题:区块链百万年薪人才招聘,必会这58个知识点

    2018年区块链行业热度不减 投资人青睐 创业者追捧 而区块链人才成了稀缺性物种 拉勾网发布的 2018年区块链高薪清单 中 腾讯 阿里等大厂将区块链岗位的月薪最高开到了100K 有相关数据统计 2月份北京区块链岗位增加了3万多个 技术类2
  • ovirt简介

    Ovirt 调研 简介 架构 功能模块和列表 虚拟化所用的技术 kvm 是否支持分布式存储以及所用的技术 支持 gluster 虚拟网络能够实现哪些功能 VLAN 在虚拟机上最小化部署一套 简介 oVirt是一种开源分布式虚拟化解决方案 旨
  • wang_ys121账号停用及博客迁移至wonyoungsen的说明!

    从今天起 本账号wang ys121停止使用 不再更新博文 并将此账号博文逐步迁移到新的账号wonyoungsen中去 请喜欢我的同学继续关注我 谢谢
  • 远程链接redis遇到的坑

    1 安装redis参考 https cloud tencent com developer article 1653709 安装完后一直无法启动redis Dec 28 13 12 05 hecs 22391 systemd 1 Start
  • 【可视化开发】echarts点击事件

    echarts提供了点击事件方法 首先需要确定点击的范围 以横向柱状图为例 若不设置属性 添加点击事件后默认为柱型 设置可点击属性 需添加以下配置 yAxis 其余属性 silent false 坐标轴是否是静态无法交互 triggerEv
  • linux 中 安装 redis

    cd usr mkdir redis cd redis wget http download redis io releases redis 3 2 4 tar gz tar xzf redis 3 2 4 tar gz cd redis
  • PyTorch 矩阵乘法的方法总结 & 问题解答

    在机器学习和深度学习中时 矩阵运算是最常见 有效提高计算效率的方法 因为特征和权重都以向量储存 矩阵运算就显得尤为重要 诸如梯度下降 反向传播 矩阵因子分解等重要的机器学习方法 都需要基于矩阵运算 在深度学习中 神经网络将权重储存在矩阵当中
  • Java连接MySQL

    目录 1 JDBC简介 2 使用 JDBC 连接数据库 2 1 使用流程 3 详细操作 3 1 导入 jar 包 4 通过 java 语言操作数据库 4 1 连接 Mysql 数据库 4 2 增 删 改 查操作 5 部分问题 5 1 数据库
  • Spring-Data-JDBC 自定义枚举类型 转换遇到的bug (搞了半天,在 insuess中看到)

    解决思路 bug描述 issuse地址 解决方法
  • qt中如何模拟按钮点击_qt模拟键盘的三种实现方式(思路+demo)

    按照我自己的理解 qt模拟键盘分三个层次的模拟 1 单线程的模拟 2 qt框架内的模拟 可以跨线程的 3 在操作系统的图形界面内模拟 相当于模拟了一个输入法 第一种 一般就是添加多个按键 QToolButton QPushButton都可以
  • RTThread:静态线程&动态线程

    一 静态线程创建 rt thread init rt err t rt thread init struct rt thread thread const char name void void parameter entry void p
  • ❀资源帖❀ResNet,ConvNeXt,Transformer预训练模型等

    1 说在前面 部分输入网页直接开始下载 一些是自己训练后的模型 2 resnet权重文件下载地址 2 1resnet18 https download pytorch org models resnet18 5c106cde pth 2 2
  • 关于OPC UA TSN中TSN

    近日 TTTech和英特尔联合发表了一份白皮书 为寻求在工业自动化系统中实现TSN网络技术的客户提供指导 白皮书概述了所有的TSN标准 优点和特点 并描述了TTTech和英特尔今天可用的产品如何可用于开发优化的TSN设备和系统 TSN将重塑
  • 巧用WINRAR和DOS命令处理压缩数据

    开展计算机审计 首先要取得被审计单位的电子数据 然后将数据标准化 即将被审计单位提供的数据转换成便于审计人员使用的 SQL Server 或其他数据库格式的数据 因此 计算机审计首先要解决的是数据标准化问题 许多商业银行采取按天备份的策略