python学习笔记(11)文件操作

2023-05-16

一、读文件


 

读写文件是最常见的IO操作。Python内置了读写文件的函数,用法和C是兼容的。

读写文件前,我们先必须了解一下,在磁盘上读写文件的功能都是由操作系统提供的,现代操作系统不允许普通的程序直接操作磁盘,所以,读写文件就是请求操作系统打开一个文件对象(通常称为文件描述符),然后,通过操作系统提供的接口从这个文件对象中读取数据(读文件),或者把数据写入这个文件对象(写文件)。

要以读文件的模式打开一个文件对象,使用Python内置的open()函数,传入文件名和标示符:

f = open('/Users/michael/test.txt', 'r')

标示符'r'表示读,这样,我们就成功地打开了一个文件。


f=open(r'C:\Users\wuzongmei\Desktop\name.txt','r')  #打开文件
file=f.read()          #一次读取文件中的全部内容,并且复制给变量file
print(file)            #打印读取的文件内容
f.close()              #关闭文件  

由于文件读写时都有可能产生IOError,一旦出错,后面的f.close()就不会调用。所以,为了保证无论是否出错都能正确地关闭文件,我们可以使用try ... finally来实现:


try:
    f = open('/path/to/file', 'r')
    print(f.read())
finally:
    if f:
        f.close()  

但是每次都这么写实在太繁琐,所以,Python引入了with语句来自动帮我们调用close()方法:


with open('/path/to/file', 'r') as f:
    print(f.read())  

 

###f.read 和f.readline  、readlines

f.read()调用read()会一次性读取文件的全部内容,如果文件有10G,内存就爆了,所以,要保险起见,可以反复调用read(size)方法,每次最多读取size个字节的内容。

f.readline()调用readline()可以每次读取一行内容

f.readlines()调用readlines()一次读取所有内容并按行返回list

for line in f.readlines():
    print(line.strip()) # 把末尾的'\n'删掉

建议:如果文件很小,read()一次性读取最方便;如果不能确定文件大小,反复调用read(size)比较保险;如果是配置文件,调用readlines()最方便

 

###读取二进制文件

前面讲的默认都是读取文本文件,并且是UTF-8编码的文本文件。要读取二进制文件,比如图片、视频等等,'rb'式打开文件即可:


f = open('/Users/michael/test.jpg', 'rb')
f.read()
b'\xff\xd8\xff\xe1\x00\x18Exif\x00\x00...' # 十六进制表示的字节  

 

###读取非utf-8文件

要读取非UTF-8编码的文本文件,需要给open()函数传入encoding参数,例如,读取GBK编码的文件:


f = open('/Users/michael/gbk.txt', 'r', encoding='gbk')
f.read()
'测试'  

遇到有些编码不规范的文件,你可能会遇到UnicodeDecodeError,因为在文本文件中可能夹杂了一些非法编码的字符。遇到这种情况,open()函数还接收一errors参数,表示如果遇到编码错误后如何处理。最简单的方式是直接忽略:


f = open('/Users/michael/gbk.txt', 'r', encoding='gbk', errors='ignore')  

 

读文件操作遇到的坑:

   f=open('C:\Users\wuzongmei\Desktop\name.txt','r')

问题一:打开文件报错:(unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: truncated \UXXXXXXXX escape

后来发现:

在Python中 是转义符,\u表示其后是UNICODE编码,因此\User在这里会报错,在字符串前面加个 r(rawstring  原生字符串),可以避免python与正则表达式语法的冲突!

解决:  f=open(r'C:\Users\wuzongmei\Desktop\name.txt','r')

问题二:再次运行继续报错:OSError: [Errno 22] Invalid argument: '\u202aC:\\Users\\wuzongmei\\Desktop\\name.txt

开始怀疑是路径中有/U导致的,找了许久解决办法,最好直接搜索\u202a才找到解决办法,因为我直接通过文件属性的安全Tab下复制的路径,只需从写换个地方复制路径或则重新手动输入一次就解决了。

问题三:文件不存在:FileNotFoundError: [Errno 2] No such file or directory: '/Users/michael/notfound.txt'

 

二、写文件


 

写文件和读文件是一样的,唯一区别是调用open()函数时,传入标识符'w'或者'wb'表示写文本文件或写二进制文件:


f=open(r'C:\Users\wuzongmei\Desktop\name.txt','w')
f.write('hello,world')
f.close()  

你可以反复调用write()来写入文件,但是务必要调用f.close()来关闭文件。当我们写文件时,操作系统往往不会立刻把数据写入磁盘,而是放到内存缓存起来,空闲的时候再慢慢写入。只有调用close()方法时,操作系统才保证把没有写入的数据全部写入磁盘。忘记调用close()的后果是数据可能只写了一部分到磁盘,剩下的丢失了。所以,还是用with语句来得保险:


with open(r'C:\Users\wuzongmei\Desktop\name.txt', 'w') as f:
    f.write('Hello, world!')  

要写入特定编码的文本文件,请给open()函数传入encoding参数,将字符串自动转换成指定编码。

细心的童鞋会发现,以'w'模式写入文件时,如果文件已存在,会直接覆盖(相当于删掉后新写入一个文件)。如果我们希望追加到文件末尾怎么办?

可以传入'a'以追加(append)模式写入。

 

转载于:https://www.cnblogs.com/wuzm/p/11562857.html

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

python学习笔记(11)文件操作 的相关文章

  • Linux内核设计与实现 原书第3版中文版pdf

    下载地址 xff1a 网盘下载 内容简介 编辑 Linux内核设计与实现 原书第3版 基于Linux 2 6 34内核详细介绍了 Linux内核系统 xff0c 覆盖了从核心内核系统的应用到内核设计与实现等各方面的内容 Linux内核设计与
  • STM32电路设计注意

    以后画STM32的电路板 VDDA一定要接 张JF说 VDDA是给内部的时钟电路供电的 还有一定要留 串口或者 下载调试口 xff08 串口 xff09 或者显示器接口 输入输出设备最好都留着 这样才能方便调试 转载于 https www
  • Kerloud vision 视觉无人机室内定位演示

    产品介绍 云讷科技 xff08 深圳 xff09 有限公司作为无人机之都的一家创业公司 xff0c 旨在立足智能技术 xff0c 传播科技文化 xff0c 可以提供以无人系统为主打的行业方案和教育方案 xff0c 包括无人机飞行控制器 视觉
  • 欢迎走进VSLAM

    1 开启新技术之门 SLAM xff0c 全称叫做Simultaneous Localization and Mapping xff0c 中文叫做同时定位与建图 SLAM技术发展到如今已经几十年 xff0c 目前以激光雷达作为主传感器的SL
  • 《Opprentice: Towards Practical and Automatic Anomaly Detection Through Machine Learning》 笔记

    以下我为这篇 Opprentice Towards Practical and Automatic Anomaly Detection Through Machine Learning 做的阅读笔记 Jeanva ABSTRACT Howe
  • linux系统如何进行录屏

    linux系统如何录屏 安装SimpleScreenRecorder 按Ctrl 43 ALt 43 T打开终端 添加源 xff1a sudo add apt repository ppa maarten baert simplescree
  • 立体视觉 之 三个坐标系

    计算机视觉中 xff0c 常用的有三个坐标系 xff1a 图像坐标系 相机坐标系和世界坐标系 它们之间的关系 xff0c 可以通过三个变换 来表示 xff1a 仿射变换 xff0c 投影变换 xff0c 刚体变换 这三个变换是三维重构几何框
  • IIS部署网站(建站)

    双击IIS图标 xff0c 运行IIS服务器 xff1b 如下图所示 xff1a 2 IIS打开后 xff0c 选中网站 xff0c 然后右键 xff0c 在弹出的菜单中 xff0c 选择新建 xff0c 然后选择网站 xff1b 如下图所
  • 自动化学报投稿过程记录

    2017年2月28号 注册账号后投稿2017年3月2号 稿件状态中有了管理员的名字 xff0c 不再是默认的admin center xff0c 同时显示等待主编指定副主编2017年3月15号左右 等待编委选择审稿人2017年3月22号 收
  • 树莓派入门之装系统

    1 首先下载一个格式化SD卡的工具 xff0c 格式化SD卡https www sdcard org downloads formatter 4 eula windows 2 下载Win32 DiskImager xff0c 这是一个把镜像
  • php的la框架,PHP“企业模式”直观描述(lavale,yii,thinkphp)

    相信大家都接触过php框架吧 xff0c lavale xff0c yii xff0c thinkphp xff0c 简单来书这些都是企业模式 这些模板虽然各不相同 xff0c 各具优势 xff0c 但是归根结底都是一样的 xff0c 框架
  • 网络摄像头100万至500万分辨率多少?传输带宽占用多少?存储空间是多少?

    网络摄像头100万 200万 300万 400万 500万分辨率多少 xff1f 传输带宽分别是多少 xff1f 存储空间是多少 xff1f 500W 2560 1920 300W 2048 1536 200W 1920 1080 200W
  • generate报错 make_melodic版本运行 catkin_make后报错

    因为之前貌似找不到navigation 所以我在src目录下git clone了官方的navigation 然后发现 43 43 43 processing catkin package 39 amcl 39 61 61 gt add su
  • 树莓派无人机开发指南之一:系统篇

    一 树莓派介绍 树莓派作为一款物美价廉的微型电脑 xff0c 被广发应用于物联网 开源电子和机器人等领域 它的官方组织是Raspberry Pi foundation xff0c 并被Broadcom公司支持 树莓派版本从2012年开始至今
  • python以下划线开头的变量名含义

    Python核心风格 xff1a 避免用下划线作为变量名的开始 因为下划线对解释器有特殊的意义 xff0c 而且是内建标识符所使用的符号 xff0c 我们建议程序员避免用下划线作为变量名的开始 一般来讲 xff0c 变量名 xxx被看作是
  • 【eclipse】eclipse报错:the resource is not on the build path of a java project

    最近在eclipse中 xff0c 使用svn导入svn上的一个maven项目 xff0c 但是导入后类的包并没有以源码包的方式显示 xff0c 而是以普通文件包的方式显示出来 xff0c 在对类进行F3等操作时就报错 xff1a the
  • 为什么有的网页右击没有出现审查元素

    当前网页使用的是兼容模式 xff0c 所以不会出现审查元素 xff0c 切换为极速模式即可 转载于 https www cnblogs com olivertian p 11268380 html
  • java第二次动手动脑

    import java math BigInteger import java util Scanner public class CalculateN 64 param args public static void main Strin
  • mui星级评价模块

    lt div class 61 34 icons 34 style 61 34 float left 34 gt lt i data index 61 34 1 34 class 61 34 mui icon mui icon star 3
  • ASP.NET WebApi 启动默认的HelpPage文档注释

    第一步 xff1a 启动HelpPageConfig中xml文档 将HelpPageConfig中的Register方法中的第一行代码注释给去掉 xff0c 如图 xff1a 第二步 xff1a 生成网站时 xff0c 填写 输出 网站xm

随机推荐