在实际工作中,经常会涉及到需要去替换文件中某一个词,而传统的做法是:通过编辑软件中自带的“替换/查找”功能进行处理。但是如果涉及到成百上千个文件需要这样的处理,该怎么解决?本篇博文将介绍一种基于Python的解决方案。
1.读取文件夹中所有的文件名
Python中os库中listdir函数用于读取文件夹下的所有文件名,并返回出来列表。
fileList = os.listdir(filename)
- filename:需要批量替换内容文件所处的文件夹地址
- fileList :该文件夹下的所有文件名列表
2.读取文件内容并替换
正则表达式是将帮助我们完成符合要求字符串的替换,Python中re库是正则表达式库。
def repfilecont(filepath,content,replacecontent):
f=open(filepath,'r')
alllines=f.readlines()
f.close()
f=open(filepath,'w+')
for eachline in alllines:
content=re.sub(content,replacecontent,eachline)
f.writelines(content)
f.close()
- filepath:需要进行替换的文件名
- content:需要替换的内容
- replacecontent:替换的内容
如:repfilecont(教育学部.txt,”天津师范大学”,“天师大”)
将教育学部.txt文件中”天津师范大学”替换成”天师大”
3.批量替换文件
def repbatfilecont(filepath,content,replacecontent): filelist = File.readfilesname(filepath) content = content replacecontent = replacecontent for file in filelist: File.repfilecont(filepath+'/'+file,content,replacecontent) print(file+' 处理完毕!')
- filepath:文件夹地址
- content:需要替换的内容
- replacecontent:替换的内容
4.调用函数
File.repbatfilecont('C:\\Users\\Administrator\\Desktop\\test',"天津师范大学","天师大")
5.示例
声明
上述原码来源于我编写的oset开源库,该库旨在帮助教育研究者便捷处理日常科研、工作中遇到的问题。
作为一名非科班出身的教育技术学研究生,技术水平十分有限。近期看到教育工作者在处理数据是比较困难,包括本教育技术学的科研工作者在面对大批量数据时也是束手无策,于是萌生了为教育工作者写一个开源库的想法,意图通过简单的几行代码就可以完成诸如文件合并、字符云等复杂功能。欢迎关注该项目,如果有同学在此方面感兴趣和可以和我联系,我们一起维护该项目!
本人感兴趣的研究方向:复杂系统计算与可解释性的深度学习以及自然语言处理。微信公众号:SMNLP;个人博客:www.litan.tech。