文章目录:
一、文件概述
1.文件类别
2.文件路径
3.文件的编码方式
二、文件操作
1.文件打开
2.文件读写
3.文件关闭
三、操作实例
一、文件概述
1.文件类别
文件是一个存储在辅助存储器上的数据序列,可以包含任何数据内容。概念上,文件是数据的集合和抽象,类似地,函数是程序的集合和抽象。用文件形式组织和表达数据更有效也更为灵活。文件包括两种类型:
文本文件
和
二进制文件。
二进制文件直接由比特0和比特1组成,没有统一字符编码,文件内部数据的组织格式与文件用途有关。
二进制文件和文本文件最主要的区别在于是否有统一的字符编码
无论文件创建为文本文件或者二进制文件,都可以用“文本文件方式”和“二进制文件方式”打开,打开后的操作不同。
通过下面的实例,理解文本文件和二进制文件的区别。
#coding=utf-8
textFile = open("7.1.txt", "rt", encoding='utf-8') # t表示文本文件方式
print(textFile.readline())
textFile.close()
binFile = open("7.1.txt", "rb") # b表示二进制文件方式
print(binFile.readline())
binFile.close()
输出结果如下:
CSDN是个学习的好地方!
b'CSDN\xe6\x98\xaf\xe4\xb8\xaa\xe5\xad\xa6\xe4\xb9\xa0\xe7\x9a\x84\xe
5\xa5\xbd\xe5\x9c\xb0\xe6\x96\xb9\xef\xbc\x81'
采用文本方式读入文件,文件经过编码形成字符串,打印出有含义 的字符;采用二进制方式打开文件,文件被解析为字节(byte)流。 由于存在编码,字符串中的一个字符由2个字节表示。
2.文件路径
文件有两个关键属性,分别是“文件名”和“文件路径”。 文件名指的是为每个文件设定的名称。 文件路径,是文件存储的位置或即将存储的位置。
3.文件的编码方式
编码就是用数字来表示符号和文字,它是符号、文字存储和显示的基础。
(1)ASCII编码方式
(2)GB2312编码方式
(3)GBK编码方式
(4)Unicode编码方式
(5)UTF-8编码方式
二、文件操作
Python对文本文件和二进制文件采用统一的操作步骤,即
“打开-操作-关闭”
1.文件打开
Python通过解释器内置的open()函数打开一个文件,并实现该文件与一个程序变量的关联,open() 函数常用形式是
接收两个参数:文件名(file)和打开模式(mode)。
<变量名> = open(<文件名>, <打开模式>)
完整的语法格式为:
open(file,mode='r',buffering=-1,encoding=None,errors=None,newline=None,
closefd=True, opener=None)
参数说明:
- file: 必需,文件路径(相对或者绝对路径)。
- mode: 可选,文件打开模式
- buffering: 设置缓冲
- encoding: 一般使用utf8
- errors: 报错级别
- newline: 区分换行符
- closefd: 传入的file参数类型
- opener: 设置自定义开启器,开启器的返回值必须是一个打开的文件描述符。
注意:
open函数其中的encoding参数的默认值是None是不能读取中文字符的,所以要给encoding参数赋值为utf-8才能读取中文字符。
文件名可以是文件的实际名字,也可以是包含完整路径的名字。
模式(mode )参数有:
模式 |
描述 |
r |
以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。如果文件不存在,返回异常FileNotFoundError,默认值 |
w |
覆盖写模式,文件不存在则创建,存在则完全覆盖 |
x |
写模式,文件不存在则创建,存在则返回异常FileExistsError |
a |
打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。 |
b |
二进制文件模式。 |
+ |
与r/w/x/a一同使用,在原功能基础上增加同时读写功能 |
t |
文本模式 (默认)。 |
rb |
以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。一般用于非文本文件如图片等。 |
r+ |
打开一个文件用于读写。文件指针将会放在文件的开头。 |
rb+ |
以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。一般用于非文本文件如图片等。 |
wb |
以二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。 |
w+ |
打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。 |
wb+ |
以二进制格式打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。 |
ab |
以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。 |
a+ |
打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。 |
ab+ |
以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。 |
默认为文本模式,如果要以二进制模式打开,加上 b 。
2.文件读写
file 对象使用 open 函数来创建,下表列出了 file 对象常用的函数:
序号 |
方法及描述 |
1 |
file.flush() 刷新文件内部缓冲,直接把内部缓冲区的数据立刻写入文件, 而不是被动的等待输出缓冲区写入。 一般情况下,文件关闭后会自动刷新缓冲区,但有时你需要在关闭前刷新它,这时就可以使用 flush() 方法。 |
2 |
file.fileno() 返回一个整型的文件描述符(file descriptor FD 整型), 可以用在如os模块的read方法等一些底层操作上。 |
3 |
file.isatty() 如果文件连接到一个终端设备返回 True,否则返回 False。 |
4 |
file.read([size]) 从文件读取指定的字节数,如果未给定或为负则读取所有。 |
5 |
file.readline([size]) 读取整行,包括 "\n" 字符。 |
6 |
file.readlines([sizeint]) 读取所有行并返回列表,若给定sizeint>0,返回总和大约为sizeint字节的行, 实际读取值可能比 sizeint 较大, 因为需要填充缓冲区。 |
7 |
file.seek(offset[,whence]) 移动文件读取指针到指定位置 |
8 |
file.tell() 返回文件当前位置。 |
9 |
file.truncate([size]) 从文件的首行首字符开始截断,截断文件为 size 个字符,无 size 表示从当前位置截断;截断之后后面的所有字符被删除,其中 windows 系统下的换行代表2个字符大小。 |
10 |
file.write(str) 将字符串写入文件,返回的是写入的字符长度。 |
11 |
file.writelines(sequence) 向文件写入一个序列字符串列表,如果需要换行则要自己加入每行的换行符。 |
3.文件关闭
文件使用结束后要使用close()方法关闭,释放文件的使用授权,该方法的使用方式如下:
<变量名>.close()
三、操作实例
实例1:
文本文件逐行打印
#coding=utf-8
fname = input("请输入要打开的文件:")
fo = open(fname, "r", encoding="utf-8")
for line in fo.readlines():
print(line)
fo.close()
运行结果
如果程序需要逐行处理文件内容,建议采用上述代码格式
实例2:
对文件进行写入
#coding=utf-8
fname = input("请输入要打开的文件:")
fo = open(fname, "w+")
ls = ["唐诗", "宋词", "元曲"]
fo.writelines(ls)
for line in fo:
print(line)
fo.close()
运行结果
实例3:
自己创建一个文本文件src.txt,存储的是若干名学生的成绩,每个成绩占一行,求平均成绩并输出
#coding=utf-8
f = open("src.txt", "r")
ls = f.readlines()
ls2 = []
for i in ls:
x = eval(i.strip())
ls2.append(x)
print(sum(ls2)/len(ls2))
f.close()
实例4:
自己创建一个电话本文本文件: dhb.txt,存储的是若干人的电话,格式如图。输入姓名查找电话号码,存在则输出,否则输出“查无此人”。
#coding=utf-8
f = open("dhb.txt", "r")
ls = f.readlines()
d = {}
for i in ls:
k = i.strip().split()[0]
v = i.strip().split()[1]
d[k] = v
xm = input()
print(d.get(xm, "查无此人"))
f.close()