这一小节的内容主要是python的文件操作函数和相关内容。
文件:就是把一些数据存放起来,可以让程序下一次执行的时候直接使用而不必重新制作一份。
> 文件类型:
文本文件:以文字存储为主,读写均以“字符”为单位。
二进制文件:以图形、声音、影像为存储内容的形式,读写均以”字节“为单位。
文件后缀:
文本类型:txt、py、doc、docx、pdf、csv、xls、xml、html……
二进制类型:jpg、png、MP3、wav、mp4、mov、avi……
后缀名主要是为了帮助操作系统识别文件类型,以选择合适的打开方式6
文件打开和关闭
打开文件
open(文件名,访问模式)
f = open('test.txt', 'w')
关闭文件
f = open('test.txt', 'w') #打开文件,w模式(写模式)
f.close() # 关闭这个文件
相对路径和绝对路径
绝对路径:从盘符开始的路径
相对路径:相对当前源码所在的路径
绝对路径中为了不让\产生转义效果,需要在路径前面添加字母 r否则需要在将每个\进行转义,写为\
f = open(r"D:\helloworld\python_workspace\demo3\test.txt","w")
f.write("hello world")
f.close()
中文编码问题
f = open(r"D:\helloworld\python_workspace\demo3\test.txt","w")
f.write("你好,世界")
f.close()
f = open("test.txt","w",encoding="UTF-8") #可以通过encoding指定写入中文的字符集
f.write("你好,世界")
f.close()
文件读写
写数据(write)
f = open('test.txt', 'w')
f.write('hello world, i am here!')
f.close()
注意: 如果文件不存在那么创建;如果存在那么就先清空,然后写入数据
写数据(writelines)
f = open("test.txt","w",encoding="UTF-8")
#写法一:
f.write("十年生死两茫茫\n不思量\n自难忘\n千里孤坟\n无处话凄凉\n") #通过换行符实现输出多行效果
#写法二:
content = ["十年生死两茫茫\n","不思量\n","自难忘\n","千里孤坟\n"."无处话凄凉\n"]
f.writelines(content) #通过writelines一次性写出列表的每个元素
#写法三:
content = ["十年生死两茫茫","不思量","自难忘","千里孤坟","无处话凄凉"]
f.write("\n".join(content)) #使用字符串的join函数,为每个元素添加换行
符
f.close()
读数据(read)
使用read(num)可以从文件中读取数据,num表示要从文件中读取的数据的长度(单位是字符),如果没有传入num,那么就表示读取文件中所有的数据
#准备好需要读取的数据文件
f = open("test2.txt","w",encoding="UTF-8")
f.write("十年生死两茫茫。不思量,自难忘")
f.close()
#-----------------------------------------------------------
f = open("test2.txt","r",encoding="UTF-8")
#data = f.read() #没有指定读取的字符数,表示读取文件中所有的数据
#print(data)
data = f.read(2)
print("读取到的文件内容:",data)
data = f.read(4) #文件读取过程中的指针的定位会向后移动指定"字符数"
print("读取到的文件内容:",data)
f.close()
读数据(readline)
#准备好需要读取的数据文件
f = open("test2.txt","w",encoding="UTF-8")
f.write("十年生死两茫茫\n"*10)
f.close()
#-----------------------------------------------------------
f = open("test2.txt","r",encoding="utf-8")
while True:
content = f.readline()
if content:
print(f"{content}",end="")
else:
#print("content:",content,type(content))
break;
f.close()
读数据(readlines)
f **加粗样式**= open("test2.txt","r",encoding="utf-8")
content = f.readlines()
print(content,type(content)) #输出的类型为列表类型(list)
#遍历列表中的内容,并在前面添加行号
#写法一:
# i = 1
# for data in content:
# print(f"{i}:{data}",end="")
# i+=1
#方法二:
for i data in enumerate(content):
print(f"{i}:{data}",end="")
f.close()
所在位置(tell)
tell,返回指针当前所在的位置(指针所在位置前面的字节数)
#准备好需要读取的数据文件
f = open("test3.txt","w",encoding="gbk")
f.write("十年生死两茫茫")
f.close()
#-----------------------------------------------------------
f = open("test3.txt","r",encoding="gbk")
content = f.read(2)
print(content)
content = f.read(4)
print(content)
print("当前指针所在位置:",f.tell())
#UTF-8中1个汉字3个字节,GBK中1个汉字为2个字节
f.clos()
定位(seek)
seek,定位文件读取的指针所在位置(字节)
seek的语法规则:
seek(offset[, whence])
offset – 开始的偏移量,也就是代表需要移动偏移的字节数
whence:可选,默认值为 0。
给offset参数一个定义,表示要从哪个位置开始偏移;
0代表从文件开头开始算起,1代表从当前位置开始算起,2代表文件末尾算起。
访问模式
open(“text.txt”,mode=“r+”) #mode 设定的就是访问模式,决定以进行的文件操作能力
案例:复制图片
fin = open("鬼刀.jpg",mode="rb")
fout = open("鬼刀_copy2.jpg",mode="wb")
data = fin.read(100)
print(data,type(data))
#输出的内容以b开头表示bytes(字节)方式读取的字符串,是以十六进制表
#示的内容
while True:
data = fin.read(100) #每次读取100个字符(自定义的缓冲区大小)
if data:
fout.write(data)
else:
break
while True:
data = fin.read(100)
if data != b"": #此处需要注意为b""
fout.write(data)
else:
break
fin.close()
fout.close()
复制出的图片: