Python 搜索文件,文件过滤,pathlib模块

1,搜索文件,文件过滤

这里使用:pathlib 模块的  Path.glob(pattern)  方法,该方法可以用来过滤目标文件,以迭代器的形式返回搜索结果。

pattern: 通配符:
"*.py":搜索指定目录下所有的py后缀文件,只搜索当前目录,不搜索子目录。
"**/*.py":搜索指定目录下所有的py后缀文件,包括子目录。"**" 模式表示 “此目录以及所有子目录,递归”。换句话说,它启用递归通配:

文件名可以使用以下符号组合进行模式匹配:
" * " 匹配0个或多个字符
" ? " 仅匹配一个字符
" [] " 匹配指定范围内的字符,如[0-9]匹配数字

2,用法:

1,只遍历当前目录

import pathlib

# 构建一个pathlib.Path()对象
# 指定一个目录起始点:"F:/path_test"
p = pathlib.Path("F:/path_test")

# 遍历 F:/path_test目录下,所有的 py 文件
# 只遍历当前目录
ret = p.glob("*.py")
for item in ret:
    print(item)


""" 运行结果 
F:\path_test\01.py
F:\path_test\02.py
"""

 2,递归遍历

# ......
# 遍历 F:/path_test目录及子目录下 所有的 py 文件
# 递归遍历所有子目录
ret = p.glob("**/*.py")
for item in ret:
    print(item)


""" 运行结果 
F:\path_test\01.py
F:\path_test\02.py
F:\path_test\src\11.py
F:\path_test\src\22.py
"""

 3,Path.rglob()  递归遍历

# ......
# 遍历 F:/path_test目录及子目录下 所有的 py 文件
# 递归遍历所有子目录
# 这就像调用 Path.glob()时,通配符 pattern 前面添加了 "**/" 一样
ret = p.rglob("*.py")
for item in ret:
    print(item)


""" 运行结果 
F:\path_test\01.py
F:\path_test\02.py
F:\path_test\src\11.py
F:\path_test\src\22.py
"""

缺点:当目录树较大时,Path.glob() 耗时较长。


版权声明:本文为li1123576747原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。