最近需要在python中做大日志文件中做正则匹配
开始直接在for in 中每行做re.findall,后来发现,性能不行,就在re前面做一个基本的字符串包含判断 (str in str),如果不包含直接continue
效率对比:
1、只做一次包含判断:
real 0m13.740suser 0m12.683ssys 0m1.046s
2、做两次包含判断:
real 0m9.226suser 0m8.134ssys 0m1.069s
3、不做包含判断:
real 0m25.205suser 0m24.165ssys 0m1.021s
样本日志1G
转载于:https://www.cnblogs.com/yaoyi/p/6748048.html