最近在做学校的srt,需要数据清洗,清洗后的word里面有6张表格,为了判断word里面是否都有6张表格,写了段python代码来判断。
能实现批量读取某个文件夹内的所有docx文件,然后计算docx里的表格数量。
import os
import docx
# 判断文件后缀
def endWith(s, *endstring):
array = map(s.endswith, endstring)
if True in array:
return True
else:
return False
#待分析文件夹是D:/Files
log_d = 'D:/Files'
logFiles = os.listdir(log_d)
#在D:/Files内遍历文件
for filename in logFiles:
#判断文件是否是docx格式
if endWith(filename, '.docx'):
#建立文件绝对路径
filePath = log_d+'/'+filename
#根据绝对路径读取文件
doc = docx.Document(filePath)
#输出文件名称和表格数量
print(filename + " " + str(len(doc.tables)))
输入结果如下:
版权声明:本文为DebugMakesMeHappy原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。