Linux——操作文件的底层系统调用,探究父子进程是否可以共享文件

2023-11-02

linux操作系统奉行一切皆文件的理念,所有文件设备几乎都可以用一套系统调用即open()/close()/write()/read()等来操作。系统调用和C库调用操作文件类似。Linux自带的man手册是最权威的。通过查看man手册来查看系统调用用法。
代号 —— 代表的含义
1 —— 用户在shell环境下可操作/可执行的命令
2 —— 系统内核可调用的函数与工具
3 —— 一些常用的函数与函数库,大部分C的函数库
4 —— 设备文件的说明,通常是在 /dev下的设备
5 —— 配置文件或某些文件的格式
6 —— 游戏
7 —— 管理与协议等,例如Linux文件系统、网络协议等
8 —— 系统管理员可用的命令
9 —— 与Kernel有关的文件

注意,系统的头文件在Linux中一般存放在/usr/include目录下;下面包含的一些头文件有的带了sys,其实是include底下的子目录中的头文件

open()——打开或者创建一个文件

在这里插入图片描述
返回值类型: int——文件描述符fd,每打开一个文件,就会得到一个文件描述符,这个文件描述符是整形的,我们通过文件描述符进行读写操作。

  • 失败:-1
  • 成功:>= 0,即文件描述符;
  • mode_t是一个类型别名,实际上就是一个有符号的整数,对open函数而言,仅仅当创建新文件时才使用第三个参数

flag:打开标志
在这里插入图片描述
注意: 这些其实都是定义的一些宏,当需要使用到多个参数时,使用按位或“ | ”构成多个flag参数

也可跟随下面的方式一起使用:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
其他不一一介绍,需要使用时自查。

write()

在这里插入图片描述
返回值

  • 若成功为已经写入的字节数;
  • 若出错为-1;

注意:计划写入的字节数和函数的返回值不相等时,表示写入出现了错误,可以用来检验写入是否成功;

参数:

  • fd:写入文件的文件描述符;
  • buf:存放待写数据的缓存;
  • count:要求写入一次数据的字节数;

注意

  • 对于普通文件,写操作从文件的当前位移量处开始,若如果在打开该文件时,指定了O_APPEND选择项,则在每次写操作之前,将文件位移量设置在文件的当前结尾处。在一次成功写之后,该文件位移量增加实际写的字节数。

read()

在这里插入图片描述
返回值 :读到的字节数

  • 若已到文件尾为0;若出错为-1;

参数

  • fd:读取文件的文件描述符;
  • buf:存放读取数据的缓存;
  • count:要求读取一次数据的字节数;注意返回值是实际读到的字节数,二者并不相同;

注意:读操作从文件的当前位移量开始,在成功返回之前,该位移量增加实际读得的字节数(这个位移量是可以自己设置的);

close()

在这里插入图片描述

注意:当一个进程终止时,它所打开的文件都由内核自动关闭。在这里插入图片描述

:这些不带缓存的函数都是内核提供的系统调用;这正是和我们在C语言中学到的那些IO操作不同的地方,他们不是标准C的组成部分,但是POSIX的组成部分。

标准C对文件操作时都是通过对FILE的结构体指针进行操作的,而这里使用的是文件描述符。
文件描述符的范围是0——OPEN MAX,早期的Unix采用的上限为19(即允许每个进程打开20个文件),现在很多系统将即增加到63,Linux为1024,具体多少可以在<unistd.h>的头文件中查找。
在这里插入图片描述
在这里插入图片描述

文件描述符与文件指针
  • FILE *fdopen(int fd,const char *mode),将文件描述符转为文件指针;
  • int fileno(FILE *stream),将文件指针转换为文件描述符;

lseek函数

功能: 定位一个已打开的文件

off_t lseek(int fd,off_t offset,int whence);
  • fd:已经打开的文件描述符;
  • offset:位移量;
  • whence:定位的位置,即基准点
  • SEEK_SET:将该文件的位移量设置为距文件开始处offset个字节;
  • SEEK_CUR:将该文件的位移量设置为其当前值加offset,offset可正可负;
  • SEEK_END:将该文件的位移量设置为文件长度加offset,offset可正可负(此时若为正值,就涉及到空洞文件了,请看下面的讲解);
  • 返回值:**若成功则返回新的文件位移量(绝对位移量)**若出错为-1;定位到文件尾部时,可以返回文件的大小;
  • lseek函数也可以用来确定所涉及的文件是否可以设置位移量,如果文件描述符所引用的是一个管道或者FIFO,则lseek返回-1,并将errno设置为EPLPE;

空洞文件示例:

#include<stdio.h>
#include<fcntl.h>
#include<string.h>
#include<stdlib.h>
#include<unistd.h>
#include<errno.h>

//生成空洞文件
char *buffer = "0123456789";

int main(int argc,char *argv[])
{
	if(argc < 2)
	{
		fprintf(stderr,"-usage:%s [file]\n",argv[0]);
		exit(1);
	}

	int fd = open(argv[1],O_WRONLY | O_CREATE | O_TRUNC,0777);
	if(fd < 0)
	{
		perror("open error");
		exit(1);
	}

	size_t size = strlen(buffer) * sizeof(char);
	//将字符串写入到空洞文件中
	if(write(fd,buffer,size) != size)
	{
		perror("write error");
		exit(1);
	}
	
	//定位到文件尾部的10个字节处
	if(lseek(fd,10L;SEERK_END) < 0)
	{
		perror("lseek error");
		exit(1);
	}
	//从文件尾部的10个字节处再写入字符串
	if(write(fd,buffer,size) != size)
	{
		perror("write error");
		exit(1);
	}
	close(fd)return 0;
}

在这里插入图片描述
我们可以看到用more命令查看文件内容时,发现显示的内容只有一次写入的结果,用od
-c命令查看文件的ASSCI码,我们会发现在两次内容之间,有10个\0,这就是空洞,用vim打开该文件内容也可以看到,有10个^@符。

注:每个文件都有一个与其相关联的“当前文件偏移量”,它是一个非负整数,用以度量从文件开始处计算的字节数。通常读写操作都以文件当前偏移量处开始,并使得偏移量增加所读或所写的字节数。按系统默认,当打开一个文件时,除非指定O_APPEND选择项,否则该文件位移量被设置为0;
示例:在这里插入图片描述
运行结果如下:
在这里插入图片描述
fd = 3的原因是:
系统内部PCB存在一个文件表,以记录打开的文件,文件描述符其实就是文件表的下标
在这里插入图片描述

  • 0——FILE* stdin,标准输入
  • 1——FILE* stdout,标准输出
  • 3——FILE* stderr,标准错误输出
    本程序已经默认打开了三个文件,fd排到第四个,所以编号为3

接下来进行文件读取
在这里插入图片描述

运行结果如下:
在这里插入图片描述

应用:利用读写对文件进行复制

首先声明:我们不区分文本文件还是二进制文件
完成对一个图片的复制,我们可以使用以下的方案:

  1. 先打开原来的二进制文件
  2. 打开一个新的文件
  3. 从原来的二进制文件中读取一部分写入新文件
  4. 反复读写
  5. 直到读完,写完就停止【read() == 0作为循环停止的条件,读不到就是读完了】
  6. 完成复制
    在这里插入图片描述复制完成
    在这里插入图片描述

打开文件后,fork的子进程能否共享和父进程共享访问同一个文件?

在这里插入图片描述

我们每次打开文件以后,会在内核中产生struct file这样一个结构体,以表示打开的文件,记录着以下信息:

  • 文件偏移量(起始从0开始,文件指针随着写入数据进行偏移)
  • 引用计数(几个进程正在使用这个打开的文件)
  • inode节点(存放进程的属性信息:谁创建了,名字是什么,在磁盘哪里存储。通过这个inode节点,我们才能找到对应的这个具体的文件)
  • 打开方式:比如只读方式,只写方式打开

测试1:先打开文件再fork
在这里插入图片描述

close(fd)写在最外侧,父子进程都会关闭,每关闭一次,引用计数减1,直到为0。

运行结果如下:
在这里插入图片描述
原因如下:
在这里插入图片描述
测试2:先fork再打开文件
修改代码后,运行结果发生如下变化:
在这里插入图片描述

因为父子进程分离后,打开了各自的文件,产生了各自的struct file,不再共享文件偏移量。

在实际的应用场景中,我们更多地使用父进程打开的文件,子进程去访问这种形式。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Linux——操作文件的底层系统调用,探究父子进程是否可以共享文件 的相关文章

  • 如何在C程序中直接改变显存映射来绘制像素(无需库函数)

    是否可以通过使用 C 程序更改 RAM 中屏幕 视频即监视器 内存映射中的值来显示黑点 我不想使用任何库函数 因为我的主要目标是学习如何开发简单的操作系统 我尝试访问起始屏幕内存映射 即 0xA0000 在 C 中 我尝试运行该程序 但由于
  • 使用 Vala 和 GLib 的正则表达式

    有没有一个函数 比如http php net manual en function preg match all php http php net manual en function preg match all php 使用 GLibh
  • 删除 Python 中某些操作的 root 权限

    在我的 Python 脚本中 我执行了一些需要 root 权限的操作 我还创建并写入文件 我不想由 root 独占所有 而是由运行我的脚本的用户独占所有 通常 我使用以下命令运行脚本sudo 有办法做到上述吗 您可以使用以下方式在 uid
  • sudo pip install python-Levenshtein 失败,错误代码 1

    我正在尝试在 Linux 上安装 python Levenshtein 库 但每当我尝试通过以下方式安装它时 sudo pip install python Levenshtein 我收到此错误 命令 usr bin python c 导入
  • “./somescript.sh”和“. ./somescript.sh”有什么区别

    今天我按照一些说明在 Linux 中安装软件 有一个需要首先运行的脚本 它设置一些环境变量 指令告诉我执行 setup sh 但是我执行时犯了一个错误 setup sh 所以环境没有设置 最后我注意到了这一点并继续进行 我想知道这两种调用脚
  • 在bash中用其他文件过滤一个文件

    我有一个带有数字的文件 例如 cat file 31038467 32048169 33058564 34088662 35093964 31018168 31138061 31208369 31538163 31798862 和其他例如
  • 即使使用 rvm pkg install zlib 后也无法加载此类文件 -- zlib

    我使用 rvm 安装了 zlib 包和 ruby 1 9 3 但是每当我尝试安装时 它说宝石cannot load such file zlib 我用来安装的命令是 rvm install 1 9 3 rvm pkg install zli
  • Linux 阻塞与非阻塞串行读取

    I have 这段代码 https stackoverflow com questions 6947413 how to open read and write from serial port in c用于在Linux中从串行读取 但我不
  • 有没有办法只安装mysql客户端(Linux)? [关闭]

    Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案 有没有不需要安装整个mysql db安装包的Linux mysql命令行工具 我想做的是从服务器 1 应用程序服务器 执行将在服务器 2
  • SVN 不断提示我输入密码并拒绝缓存我的凭据

    环境 Eclipse Indigo Ubuntu 11 04 Subclipse 1 6 SVN 客户端 Subclipse RabbitVCS 我通过 svn ssh 连接 我的网址如下所示 svn ssh 我的名字 我的域名 路径 我可
  • 将 bash 脚本作为守护进程运行

    我有一个脚本 它每 X 次运行我的 PHP 脚本 bin bash while true do usr bin php f my script php echo Waiting sleep 3 done 我怎样才能将它作为守护进程启动 要从
  • 如何清理 Runtime.exec() 中使用的用户输入?

    我需要通过命令行调用自定义脚本 这些脚本需要很少的参数并在 Linux 机器上调用 当前版本容易出现各种shell注入 如何清理用户给出的参数 参数包括登录名和路径 Unix 或 Windows 路径 用户应该能够输入任何可能的路径 该路径
  • Laravel 内存问题?

    各位 我在 DO 服务器上遇到这样的问题 我已经尝试了一切 整个网站在使用 Homestead 的 Linux 服务器上 100 正常工作 但上传后 它只能工作一次 在重新加载或刷新页面后会多次下降 我尝试增加 apache 服务器的内存
  • 有没有办法让 Linux CLI IO 重定向持久化?

    我有多个管道命令 如下所示 find options grep options xargs grep options 它们中的每一个都可能产生我不感兴趣的错误 权限错误 文件名空格错误等 因此 我想将所有错误重定向到 dev null 我知
  • OS X 对 /usr/local/lib 的权限被拒绝

    我正在寻找有关权限问题的任何建议 直觉 线索 答案 自从我切换到新的 Macbook Pro 以来 这个问题一直困扰着我 这就是困境 某些程序在安装期间复制 usr local lib 下的库 并且在运行这些程序时出现崩溃 我认为这与此文件
  • shell中基于正则表达式的颜色突出显示输出

    我想知道是否可以用颜色突出显示与某些字符串匹配的 shell 命令的输出 例如 如果我运行 myCommand 输出如下 gt myCommand DEBUG foo bar INFO bla bla ERROR yak yak 我希望所有
  • 在 4.x 内核上的 64 位内存中查找系统调用表

    我正在尝试编写一个简单的内核模块来查找 Linux 中的 sys call table 但遇到了一些麻烦 我在这里找到了 32 位 Linux 的基本指南 https memset wordpress com 2011 03 18 sysc
  • 如何更改Linux服务器中的MySQL表名不区分大小写?

    我正在开发一个旧网站 该网站曾经托管在 Apple 服务器上 当它迁移到新的 Linux 服务器时 它停止工作 我很确定这是因为 php 脚本中使用的所有 MySQL 查询对于表名都有不同的大小写组合 我不知道为什么原始开发人员在创建表名或
  • 使用 xargs 时如何获取退出代码(并行)

    我制作了一个用于启动并行 rsync 进程的脚本 bin bash LIST 1 DEST DIR 2 RSYNC OPTS 3 echo rsyncing From SRC DIR To DEST DIR RSYNC OPTS RSYNC
  • 在Linux中执行jar文件[关闭]

    Closed 这个问题是无关 help closed questions 目前不接受答案 我创建了一个可执行的 Java jar 文件 也就是说 我将 java 程序正确打包到 jar 文件中 包括 META INF MANIFEST 文件

随机推荐

  • 【mcuclub】水流量检测模块-YF-S401

    一 实物图 型号 YF S401 二 原理图 编号 名称 功能 1 VCC 电源正 红色线 2 GND 电源地 黑色线 3 OUT 输出引脚 黄色线 三 简介 水流量传感器主要由塑料阀体 水流转子组件和霍尔传感器组成 它装在电器的进水端 用
  • JVM--调优--03--开发配置

    JVM 调优 03 开发配置 1 本地配置 Xmx1g Xms1g Xmn900m XX UseG1GC Xloggc gc log XX PrintGCDetails 2 linux tomcat 配置 进入tomcat的bin目录 修改
  • 软工作业 双人项目代码规范

    双人项目代码编写规范 蔡东杰 房林尧 以下共分为四个部分 缩进代码 命名规则 代码注释 异常处理 部分规范已做实例说明 后续编代码时需要严格遵守 一 关于缩进代码 一行里面只写一行代码 包括定义变量 一行只定义一个 左括号和后一个字符之间不
  • Java分支和循环语句及方法的使用

    1 分支语句No3 顺序语句 分支语句 循环语句 1 1 分支语句 选择结构 分支语句满足某种条件则执行某一部分 满足另一种条件则执行另一部分 1 2 if语句 简单分支语句 if boolean类型表达式 语句 如果小括号中的表达式成立
  • STM32中断知识点简介

    中断服务函数存放路径为启动文件 startup stm32f10x hd 1 常用的中断服务函数 外部中断服务函数 EXTI0 IRQHandler EXTI0 IRQn EXTI1 IRQHandler EXTI1 IRQn EXTI2
  • jenkins默认会存放目录

    jenkins默认会存放在用户主目录下的 jenkins文件夹中 如 Linux root用户 root jenkins 注意 这是linux版本的 windows系统请自行更改 这个值在Jenkins运行时是不能更改的 请先将Jenkin
  • 自定义coco数据集

    1 环境 anaconda环境安装配置 2 工具 安装labelme工具 3 安装软件 3 1 打开anaconda控制台 3 2 创建虚拟环境 conda create n labelme python 3 7 3 3 激活环境 cond
  • 函数调用栈

    函数调用栈 我们在编程中写的函数 会被编译器编译为机器指令 写入可执行文件 程序执行的时候 会把这个可执行文件加载到内存 在虚拟地址空间中的代码段存放 如果在一个函数中调用另一个函数 编译器就会对应生成一条call指令 当程序执行到这条ca
  • 不使用mybatis的@Param有的报错有的却不报错问题

    前几天更换电脑重新安装新的idea发现在dao层 有的同事没有使用 Param注解 导致系统报错 错误如下 org mybatis spring MyBatisSystemException nested exception is org
  • 显示实例化和显示具体化

    struct man int age double salary 显示具体化 指定模板函数中类型 意思是不要使用swap模板来生成函数定义 而是要使用专门为job类型显示定义的函数定义 因为job是一个结构体 所以swap不可能是直接的利用
  • Flutter的Stepper

    文章目录 Flutter的Stepper的简介 Stepper的详细介绍 使用方法 导入flutter material dart包 创建状态变量 创建Stepper 创建一个Step widget列表 典型用法 Step对象的创建 例子
  • 2023 1.2 Scala变量与数据类型

    学习目标 学会变量声明 掌握数据类型 初学Scala时 建议读者在Scala命令行模式中操作 最终程序的编写可以在IDE中进行 在Windows的CMD窗口中或CentOS的Shell命令中执行scala命令 即可进入Scala的命令行操作
  • uni-app列表组件 list组件,简单好用通用

    随着技术的发展 开发的复杂度也越来越高 传统开发方式将一个系统做成了整块应用 经常出现的情况就是一个小小的改动或者一个小功能的增加可能会引起整体逻辑的修改 造成牵一发而动全身 通过组件化开发 可以有效实现单独开发 单独维护 而且他们之间可以
  • Dockerfile 中 配置安装 php 扩展

    我的个人博客 逐步前行STEP 以下配置实现了 在docker环境中安装scwl中文分词的php扩展 scwl RUN curl http www xunsearch com scws down scws 1 2 3 tar bz2 o s
  • 管理回收站+启用/禁用回收站+查看回收站信息+清空回收站对象

    管理回收站 1启用 禁用回收站 1 关闭回收站 alter session set recyclebin off show parameter recyclebin 2 启用回收站 alter session set recyclebin
  • Mockito 的 MockMvc:零基础教程

    Mockito 的 MockMvc 零基础教程 大家好 今天 我们将一起学习 Mockito 的 MockMvc 在这篇零基础教程中 我们将介绍 MockMvc 的概念 应用场景 快速上手方法 常用特性 注意事项以及原理概述 让我们以轻松幽
  • 【手把手教你用Matlab做双目摄像头标定】Ubuntu环境

    手把手教你用Matlab做双目摄像头标定 Ubuntu20 04环境 准备工作 你需要一个标定板 你需要一个双目摄像头 获取双目摄像头的设备号 跑起来看看 分割图像并完成拍照 使用Matlab进行标定 准备工作 你需要一个标定板 一个高精度
  • gcc warning: warning: 'tick' may be used uninitialized in this function

    是因为没有初始化tick 详见 http blog csdn net max415 archive 2008 05 17 2454165 aspx
  • 152. Maximum Product Subarray dynamic programming

    Find the contiguous subarray within an array containing at least one number which has the largest product For example gi
  • Linux——操作文件的底层系统调用,探究父子进程是否可以共享文件

    linux操作系统奉行一切皆文件的理念 所有文件设备几乎都可以用一套系统调用即open close write read 等来操作 系统调用和C库调用操作文件类似 Linux自带的man手册是最权威的 通过查看man手册来查看系统调用用法