fileinput模块用法

it2022-05-06  4

 

fileinput模块功能:

提供拼接一个或多个文本文件的功能,可以通过使用for循环来读取一个或多个文本文件的所有行,从而进行逐行处理(如进行显示、替换、添加行号等)。

其功能类似于linux命令的cat和sed。

input方法是fileinput模块的主要方法,input方法的参数将传递给FileInput类的构造器来创建FileInput类的一个实例(对象),该实例是一个迭代器,可用于for等迭代环境中,当然也可以用next()、__next__()方法,也支持readline()方法:

>>> obj_fi=fileinput.input(r'd:\syslogin.log') >>> type(obj_fi) <class 'fileinput.FileInput'> >>> print(obj_fi) <fileinput.FileInput object at 0x00A5FE90> >>> dir(obj_fi) ['__class__', '__del__', '__delattr__', '__dict__', '__dir__', '__doc__', '__enter__', '__eq__', '__exit__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__iter__', '__le__', '__lt__', '__module__', '__ne__', '__new__', '__next__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', '__weakref__', '_backup', '_backupfilename', '_file', '_filelineno', '_filename', '_files', '_inplace', '_isstdin', '_mode', '_openhook', '_output', '_readline', '_savestdout', '_startlineno', 'close', 'filelineno', 'filename', 'fileno', 'isfirstline', 'isstdin', 'lineno', 'nextfile', 'readline'] >>>

 

input方法的函数原型:

fileinput.input(files=None, inplace=False, backup='', bufsize=0, mode='r', openhook=None)

参数说明如下:

files:                  #文件的路径列表,默认是stdin方式,多文件['1.txt','2.txt',...]inplace:                #是否将标准输出的结果写回文件,默认不取代,只能替换文件内容,不能增加内容backup:                 #备份文件的扩展名,只指定扩展名,如.bak。如果该文件的备份文件已存在,则会自动覆盖。bufsize:                #缓冲区大小,默认为0,如果文件很大,可以修改此参数,一般默认即可mode:                   #读写模式,默认为只读openhook:               #该钩子用于控制打开的所有文件,比如说编码方式等;

 

input方法的说有参数都为关键字参数,在不带任何参数情况下,将使用命令行列出的所有文件(命令行参数列表:sys.argv[1:]),如果命令行也没有参数,则文件默认为 标准输入( sys.stdin),如果文件名为'-',也使用标准输入sys.stdin.。通常指定一个文件名列表作为input()方法的第一个参数,当然单个文件名也是允许的,也可以使用files=(‘file1‘,‘’file2‘’)格式传递文件名。下面是使用标准输入作为文件名的使用格式:

import fileinput for line in fileinput.input(): process(line)

 

从3.2版本开始,fileinput实例可以用于上下文管理器,如:

with fileinput.input(files=('spam.txt', 'eggs.txt')) as f: for line in f: process(line)

 

特别注意:关键字参数 inplace=True的使用

1、如果传递了inplace=True关键字参数,则标准输出会被重定向为打开的文件,但例外的的是:如果传入的文件为标准输入,则该替换功能自动被禁用。

2、对于非标准输入文件,将用backup='.<some extension>'关键字指定的值(缺省为'.bak')作为扩展名重命名(相当于用linux的move命令)原文件,如果先前已经存在重命名的文件则直接无提示替换,同时自动将标准输出重定向为原输入文件,这就能够轻松的修改原文件,所以一定要用print打印到标准输出,如果没有用print打印到标准输出,就会把空内容回写到文件,也就是清除了文件所有内容。

 

fileinput模块的常用方法:

input()         #模块的主要方法,返回能够用于for循环遍历的对象,该对象可迭代filename()   #返回当前正在读取的文件名,如果第一行被读取之前调用将返回Nonefileno()        #返回当前文件的文件描述符(1个整数),没有文件被打开(第一行之前或文件之间的时刻)将返回-1lineno()       #返回当前已经累加读取的行的数量(或者序号)filelineno()     #返回当前读取的行的行号,第一行读取之前返回0,最后文件的最后行被读取之后调用,将返回最后一行所在文件的行号isfirstline()     #检查当前行是否是所在文件的第一行,如果是则返回True,否则Falseisstdin()      #如果上一行是从sys.stdin(标准输入)读取的,则返回True,否则False

nextfile()   #关掉当前文件以便从下个文件的第一行开始迭代读取

 

单个文件内容简单替换:

1 import fileinput 2 for line in fileinput.input('test.txt',backup='.bak',inplace=1): 3 print line.replace('Python','LinuxEye'), 4 fileinput.close()

 

 

文件内容通过正则表达式查找替换,并将原文件备份:

1 import fileinput 2 import re 3 obj_fileinput=fileinput.input(r'd:\test.txt',inplace=True,backup='.bak') 4 for line in obj_fileinput: 5 obj_re1 = re.compile(r'\bsubstitute\b', re.I | re.M) 6 content= obj_re1.sub('substitute has been replace' , line) 7 obj_re2 = re.compile(r'\breplace\b', re.I | re.M) 8 print(obj_re2.sub('in place', content)) 9 fileinput.close()

 

判断是否是第一行:

1 import fileinput 2 for line in fileinput.input(r'd:\test.txt'): 3 if fileinput.isfirstline(): 4 print(line) 5 else: 6 break 7 fileinput.close()

 

读取多个文件:

1 import fileinput 2 from glob import glob 3 for line in fileinput.input(glob(r'd:\*.txt')): 4 print(fileinput.lineno(), u'文件:', fileinput.filename(), u'行号:', fileinput.filelineno()) 6 fileinput.close()

 

从标准输入读取内容:

1 import fileinput 2 3 for line in fileinput.input(): 4 print(fileinput.lineno(),': ', line) 6 fileinput.close()

 

转载于:https://www.cnblogs.com/dingbj/p/fileinput.html

相关资源:python使用fileinput模块实现逐行读取文件的方法

最新回复(0)