C 二进制文件与文本文件的效率

2024-02-10

我是 C 语言新手，我需要一些帮助。假设我只需要在文件中存储 6 位数字。（假设 int 的大小等于 4）使用文本文件或二进制文件哪个更有效（就内存而言）？我不太确定如何面对这个问题，欢迎任何帮助

大多数人将文件分为两类：二进制文件和 ASCII（文本）文件。实际上，您两者都曾合作过。您编写的任何程序 (C/C++/Perl/HTML) 几乎肯定是 ASCII 文件。

ASCII 文件被定义为由 ASCII 字符组成的文件。它通常是使用 emacs、pico、vi、记事本等文本编辑器创建的。有一些更高级的编辑器可用于编写代码，但它们可能并不总是将其保存为 ASCII。 ASCII 是国际标准。

计算机科学就是创造良好的抽象。有时会成功，有时则不会。好的抽象就是呈现用户可以使用的世界视图。最成功的抽象之一是文本编辑器。

当您编写程序并输入注释时，很难想象这些信息不会被存储为字符。 ASCII/文本文件实际上存储为 0 和 1。

文件存储在磁盘上，磁盘有某种方式来表示 1 和 0。我们仅仅将它们称为 1 和 0，因为这也是一种抽象。无论使用什么方式将 0 和 1 存储在磁盘上，我们并不关心，只要我们能这样思考即可。

实际上，ASCII 文件基本上是二进制文件，因为它们存储二进制数。也就是说，ASCII 文件存储 0 和 1。

ASCII 和二进制文件之间的区别？

ASCII 文件是存储 ASCII 代码的二进制文件。回想一下，ASCII 代码是存储在字节中的 7 位代码。更具体地说，有 128 种不同的 ASCII 码，这意味着只需要 7 位即可表示一个 ASCII 字符。

然而，由于最小可用大小为 1 字节，因此这 7 位是任何字节的低 7 位。最高有效位是 0。这意味着，在任何 ASCII 文件中，您都浪费了 1/8 的位。特别是，每个字节的最高有效位没有被使用。

尽管 ASCII 文件是二进制文件，但有些人将它们视为不同类型的文件。我喜欢将 ASCII 文件视为特殊类型的二进制文件。它们是二进制文件，其中每个字节都以 ASCII 代码编写。

完整的通用二进制文件没有这样的限制。任何 256 位模式都可以在二进制文件的任何字节中使用。

我们一直使用二进制文件。可执行文件、目标文件、图像文件、声音文件和许多文件格式都是二进制文件。它们之所以成为二进制，仅仅是因为二进制文件的每个字节都可以是 256 位模式之一。它们不限于 ASCII 代码。 ASCII 文件示例

假设您正在使用文本编辑器编辑文本文件。因为您使用的是文本编辑器，所以您几乎是在编辑 ASCII 文件。在这个全新的文件中，您输入“cat”。也就是说，字母“c”，然后是“a”，然后是“t”。然后，保存文件并退出。

会发生什么？目前，我们不关心打开文件、修改文件和关闭文件的机制。相反，我们关心的是 ASCII 编码。

如果您查找 ASCII 表，您会发现 ASCII 代码为 0x63、0x61、0x74（0x 仅表示这些值是十六进制，而不是十进制/以 10 为基数）。

Here's how it looks:
ASCII   'c'        'a'          't'
Hex     63          61          74
Binary  0110 0011   0110 0001   0111 1000

每次输入 ASCII 字符并保存时，都会写入与该字符相对应的整个字节。这包括标点符号、空格等。

因此，当您键入“c”时，它会以 0110 0011 的形式保存到文件中。

现在，有时文本编辑器会输入您可能意想不到的字符。例如，一些编辑器“坚持”每行以换行符结尾。

文件唯一可能在行尾缺少换行符的地方是最后一行。有些编辑器允许最后一行以除换行符之外的其他字符结尾。一些编辑器在每个文件末尾添加换行符。

不幸的是，即使换行符也不是普遍标准。在 UNIX 文件上使用换行符很常见，但在 Windows 中，通常使用两个字符来结束每一行（回车符、换行符，我相信是 \r 和 \n）。当只需要一个字符时为什么要使用两个字符？

这可以追溯到打印机。在过去，打印机返回到行首所花费的时间等于键入两个字符所花费的时间。因此，在文件中放置了两个字符，以便打印机有时间将打印机球移回行首。

这个事实并不那么重要。大部分都是琐事。我之所以提出这个问题，是为了防止您想知道为什么将文件从 Windows 传输到 UNIX 有时会生成有趣的字符。编辑二进制文件既然您知道在 ASCII 文件中键入的每个字符都对应于文件中的一个字节，您可能会理解为什么编辑二进制文件很困难。

如果您想编辑二进制文件，您确实想编辑各个位。例如，假设您想编写二进制模式 1100 0011。您会如何执行此操作？

您可能很天真，在文件中输入以下内容：

11000011

但现在您应该知道，这并不是编辑文件的各个部分。如果您输入“1”和“0”，则实际上输入的是 0x49 和 0x48。也就是说，您要在文件中输入 0100 1001 和 0100 1000。您实际上一次（间接）输入 8 位。

有些程序允许您输入 49，并将其转换为单个字节 0100 1001，而不是表示“4”和“9”的 ASCII 代码。您可以将这些程序称为十六进制编辑器。不幸的是，这些可能并不那么容易获得。编写一个程序并不太难，该程序读取看起来像十六进制对的 ASCII 文件，然后将其转换为具有相应位模式的真正的二进制文件。

也就是说，它需要一个如下所示的文件：

63 a0 de

并将该 ASCII 文件转换为以 0110 0011 开头（二进制为 63）的二进制文件。请注意，该文件是 ASCII，这意味着真正存储的是“6”、“3”、“ ”（空格）、“a”、“0”等的 ASCII 代码。程序可以读取此 ASCII 文件，然后生成适当的二进制代码并将其写入文件。

因此，ASCII 文件可能包含 8 个字节（6 个字符，2 个空格），输出二进制文件将包含 3 个字节，每个十六进制对一个字节。

写入二进制文件

为什么人们仍然使用二进制文件？原因之一是紧凑性。例如，假设您要写入数字 100000。如果您以 ASCII 键入它，则需要 6 个字符（即 6 个字节）。但是，如果将其表示为无符号二进制，则可以使用 4 个字节将其写出。

ASCII 很方便，因为它往往是人类可读的，但它会占用大量空间。您可以使用二进制文件更紧凑地表示信息。

例如，您可以做的一件事是将对象保存到文件中。这是一种序列化。要将其转储到文件，可以使用 write() 方法。通常，您将指向对象的指针和用于表示该对象的字节数（使用 sizeof 运算符来确定）传递给 write() 方法。然后，该方法将内存中出现的字节转储到文件中。

然后，您可以从文件中恢复信息并将其放入对象中，方法是使用相应的 read() 方法，该方法通常采用指向对象的指针（并且它应该指向已分配内存的对象，无论是静态还是动态）已分配）和对象的字节数，并将字节从文件复制到对象中。

当然，你必须小心。如果您使用两种不同的编译器，或者将文件从一种机器传输到另一种机器，则此过程可能不起作用。特别地，对象可以不同地布置。这可以像字节顺序一样简单，也可能存在填充问题。

这种将对象保存到文件的方法既简单又好用，但可能不太便携。此外，它相当于浅复制。如果您的对象包含指针，它将把地址写到文件中。这些地址可能完全没有意义。地址在程序运行时可能有意义，但如果退出并重新启动，这些地址可能会改变。

这就是为什么有些人发明了自己的对象存储格式：以提高可移植性。

但是，如果您知道您没有存储包含指针的对象，并且您在编写该文件的同一类型计算机系统上读取该文件，并且您使用相同的编译器，那么它应该可以工作。

这是人们有时更喜欢写出整数、字符等而不是整个对象的原因之一。它们往往更便携。

ASCII 文件是由 ASCII 字符组成的二进制文件。 ASCII 字符是存储在一个字节中的 7 位编码。因此，ASCII 文件的每个字节的最高有效位都设置为 0。将 ASCII 文件视为一种特殊类型的二进制文件。

通用二进制文件使用全部 8 位。二进制文件的每个字节可以具有完整的 256 个位串模式（与仅具有 128 个位串模式的 ASCII 文件相反）。

也许有一天，Unicode 文本文件会变得更加流行。但目前，ASCII 文件是文本文件的标准格式。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

C 二进制文件与文本文件的效率的相关文章

异步回调到BackgroundWorker

我想使用 NET FTP 库 http netftp codeplex com http netftp codeplex com 该库提供 BeginOpenRead string AsyncCallback object 使用异步编程模型
编译错误：尝试在函数调用中指定参数类型时出现“预期在 ' ' 之前出现主表达式”

当我编译我的程序时我收到以下错误消息 stringPerm cpp In function int main stringPerm cpp 12 error expected primary expression before word
在 MS word .docs 中插入 MathMl 、 Tex 或 LaTex 方程？

我一直在寻找 C 中 Net 的一些 dll 用于在 MS Word 中插入任何 MathMl Tex 或 LaTex 方程我尝试了一些类似 DocX 的工具但它们失败了你知道吗或任何提示如何做到这一点谢谢 Word 2007 可
使用 C# 在 Windows 窗体应用程序中正确使用 OnClick 与 MouseClick 事件

我目前正在开发一个自定义控件并意识到我的代码正在运行两次这实际上并不是一个大问题它只是 Focus 方法调用不过我想了解一下从阅读点击 MSDN说明单击事件 http msdn microsoft com en us libra
创建动态对象

如何动态创建对象 string columnNames EmpName EmpID PhoneNo List
获取在 Unity 中实现接口的所有类型

如果您只想知道解决方案请跳至更新我有一个应用程序它使用以下代码来获取并运行许多工作方法 var type typeof IJob var types AppDomain CurrentDomain GetAssemblies Sele
C# 中具有字符串键类型的不区分大小写字典

如果我有一个Dictionary
send() 使我的程序崩溃

我正在运行服务器和客户端我正在我的计算机上测试我的程序这是服务器中向客户端发送数据的函数 int sendToClient int fd string msg cout lt lt sending to client lt lt fd
将二维整数作为 Readonly/const 存储在单独的类中，同时保持非公开

这是我在使用这个地方作为我的去处以获取关于什么有效无效为什么等的一般意见之后的第一个问题那么让我们试试这个由于我的经验有限我一直在尝试寻找更好的方法来创建固定数据字段我可以在整个程序中引用这些字段例如我反复显示的最终用户可
为什么 ATOMIC_FLAG_INIT 为假？

In C 11有std atomic flag这对于线程循环很有用 static std atomic flag s done ATOMIC FLAG INIT void ThreadMain while s done test and s
数据绑定问题，请解释

public partial class Form1 Form MyClass myClass new MyClass one two public Form1 InitializeComponent textBox1 DataBindin
std::regex 的行为不一致

我有以下问题 std regex如果我传递结果行为会有所不同boost filesystem path string vs 将结果存储在中间字符串变量中第一个将返回一个被截断的匹配并且稍后不被接受std stoull 抛出 inval
allocator.construct 循环是否等于 std::uninitialized_copy？

在此背景下T是某种类型并且allocator是该类型的分配器对象默认情况下是std allocator
cygwin $'\r'：命令未找到错误

我稍微修改了一个项目在调试下它运行得很好当我尝试在不调试的情况下构建它时它显示错误无法修复它 make Making all in third party make 1 Entering directory cygdrive c U
CGAL：如何有效计算多面体的面面积？

我有一个多面体其面是三角形我知道在 CGAL 中 Triangle 3 类提供了 squared area 方法通过它我们可以计算三角形的面积有什么方法可以将其应用到多面体方面吗或者关于如何计算每个面的面积有什么想法吗这是一个例
计算距离早上 8 点还有多少小时

我知道如何计算两个日期之间的差异但如何计算给定日期与下一个上午 8 点之间的时间 var now DateTime Now var tomorrow8am now AddDays 1 Date AddHours 8 double tota
是否有在 Windows 窗体应用程序中以最少的设置使用 CefGlue 或 CefSharp 的示例？

我仍然使用 Visual Studio 2005 并希望将 webkit 浏览器嵌入到 c winforms 应用程序中最好作为 winforms 控件我正在寻找 CefGlue 或 CefSharp 的简单示例以及所需的最少 dl
什么时候适合在 C++ 中使用 static（在未命名的命名空间上）？

我一整天都在阅读有关未命名命名空间的文章大多数文章都解释了何时应该在 static 关键字上使用未命名命名空间但我仍然有一个大问题什么时候适合使用静态毕竟它还没有完全弃用那么带有静态函数的头文件我现在应该将它们放入未命名的命名空间中
最有用的用户制作的 C 宏（在 GCC 中，还有 C99）？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
在实体框架中比较日期的最佳方法

我在实体框架的 where 子句中使用日期并收到以下错误这是由于以下代码 var entity dbContext MyTable Where w gt w PId 3 w CreatedOn Date mydate Date First

随机推荐

我可以在 Android 中找到我的接入点的 MAC 地址吗？

我的 Android 应用程序可以找到它所连接的 Wifi 接入点的 MAC 地址吗 android net wifi WifiInfo getMacAddress 的文档未提供任何详细信息 See http developer andro
在 C（非 C++）中使用 fork() 从 1 个父级中生成 3 个子级

您好我一直在开发一个程序该程序会分叉孩子稍后将从每个孩子中分叉出更多的孩子但这不是我需要帮助的当我运行我的程序时在这里它是一个函数但工作原理相同我应该有一个父级 PPID 生成 3 个子级 PIDS 1 2 3 但我得到的是
AngularJS：使用“sortFn”和“groups”时，ng-grid 不起作用

我想知道是否可以自定义排序和分组以使用同一列我在 Plunker 中做了一个例子其中 groups 选项被注释掉当取消注释该行时网格不会显示任何记录 scope myData complex name Felipe order 3
如何使用 laravel 在数据库中插入多维数组

我正在 Laravel 中开发电子商务应用程序我想在客户单击结帐按钮时保存购物车值订单和订单详细信息表一份订单有很多订单详细信息我可以插入订单值客户 ID 订单日期发货日期订单金额但正如我所提到的一个订单有许多订单详细信息
Xcode 5 错误 CertUIFramework.axbundle

我希望有人遇到过这些错误并且知道如何修复它这是 Xcode 5 b4 中突然出现的控制台输出 Platforms iPhoneSimulator platform Developer SDKs iPhoneSimulator7 0 sdk
第二次自动对焦后takePicture失败

我正在开发一个 Android 相机应用程序使用自动对焦这个问题我能够第一次捕获但是当我第二次尝试捕获时会发生以下异常 4 19 11 28 32 509 E AndroidRuntime 4409 FATAL EXCEPTION
针对同一集群的多个 kafka 架构注册表

我正在尝试针对同一个 kafka 和 Zookeeper 集群安装两个 kafka 架构注册表实例但希玛正在变得混杂运行两个注册表时如果我使用 api kafka schema registry 注册一个模式它似乎是在 schema
使用 Spring Boot 从 Gradle 多模块项目构建的 Jar 不起作用

我创建了 spring boot gradle 多模块项目其中包含 3 个模块控制器服务存储库主文件位于控制器模块中名为 MySpringBootApplication 我可以构建这个项目使用 gradle build 并可以
如何将值传递给 Make，该值将传递给 C 代码

我正在寻求帮助让我的 Makefile 执行我想要的操作我已经弄清楚如何将预处理代码添加到我的 C 源代码中该代码仅在我编译调试时才会编译 if DEBUG printf main n Pauses execution so gdb c
加速 jsonb 对象数组中嵌套的键值的范围测试

假设我有以下内容parents table create table parents id integer not null constraint parents pkey primary key name text not null ch
如何将哈希键转换为方法名称？

这是我的哈希 tempData a gt 100 here gt 200 c gt hello 我需要以如下方法访问哈希键 tempData a 100 tempData here 200 你可以将你的哈希值包装在一个开放结构 http w
拍照或从库获取图像的权限未在 iOS 9 中显示（Xcode 7beta、Swift 2）

下面的代码显示了我访问图像库的示例无论我在哪里调用代码视图我都看不到手机弹出的权限对话框因此无法允许我的应用程序访问相机或库此外隐私设置也不显示我的应用程序有什么想法吗我要疯了 let imgPicker UIImagePi
Android 应用程序启动首次启动需要更多时间，甚至有时需要 30 秒或更长时间

以下是应用程序首次安装时的日志 05 12 13 16 23 632 28250 28250 com app projectName W 系统类加载器引用未知路径 data app com app projectName 1 lib ar
有没有扩展表的SQL函数？

我依稀记得有一个函数可以做到这一点但我想我可能会发疯假设我有一个数据表称之为 table1 它有三列 column1 column2 column3 查询 SELECT FROM table1 返回 table1 中的所有行列是否
使用 CSS3 font-face 的正确方法是什么？

有人可以帮我理解使用 CSS3 font face 的正确方法是什么吗下面是一些字体声明哪一个是正确的为什么 START OF SAMPLE CODE 1 font face font family WebFont src url w
淘汰赛验证异步验证器：这是一个错误还是我做错了什么？

我真的很喜欢如何Eric Barnard 的淘汰赛验证库 https github com Knockout Contrib Knockout Validation与可观察量集成允许分组并提供自定义验证器可插拔性包括动态验证器有几个
Selenium Grid 与不同主机上的 Docker 容器

我喜欢使用官方 Docker 镜像在 AWS 上设置 Selenium Grid 可以在此处找到https github com SeleniumHQ docker selenium https github com SeleniumHQ
从 Docker 容器获取环境变量

从 docker 容器获取环境变量的最简单方法是什么尚未在 Dockerfile 中声明的内容例如通过某些方式设置的环境变量docker exec container bin bash会议我可以docker exec containe
python 中的 3D 卷积

我需要编写一段代码使用 numpy 在 python 中使用 3x3 内核执行 3D 卷积我已经对像黑白图像这样的 2D 数组做了正确的处理但是当我尝试将其扩展到像 RGB 这样的 3D 数组时情况就变得一团糟我需要帮助来改进我的
C 二进制文件与文本文件的效率

我是 C 语言新手我需要一些帮助假设我只需要在文件中存储 6 位数字假设 int 的大小等于 4 使用文本文件或二进制文件哪个更有效就内存而言我不太确定如何面对这个问题欢迎任何帮助大多数人将文件分为两类二进制文件和 ASCI

C 二进制文件与文本文件的效率

C 二进制文件与文本文件的效率 的相关文章

随机推荐

热门标签

C 二进制文件与文本文件的效率的相关文章