python压缩解压缩:rar, zip,tar, gz压缩,解压缩文件

1.概述

  • 在平时自动化测试工作中,经常会用python对一些文件进行读写操作。其中使用最多的文件格式,就是txt, log, json, csv, xml, zip, tar, gz, rar, excel,这十种文件格式。
  • rar, zip,tar, gz这四种格式,需要使用python的第三方库进行操作。

2.简介

  • gz: 即gzip,通常只能压缩一个文件。与tar结合起来就可以实现先打包,再压缩。
  • tar: linux系统下的打包工具,只打包,不压缩
  • tgz:即tar.gz。先用tar打包,然后再用gz压缩得到的文件
  • zip: 不同于gzip,虽然使用相似的算法,可以打包压缩多个文件,不过分别压缩文件,压缩率低于tar。
  • rar:打包压缩文件,最初用于DOS,基于window操作系统。压缩率比zip高,但速度慢,随机访问的速度也慢

3.tar, gz

  • 压缩
import os, tarfile
#一次性打包整个根目录。空子目录会被打包。
#如果只打包不压缩,将"w:gz"参数改为"w:"或"w"即可。
def make_targz(output_filename, source_dir):
  with tarfile.open(output_filename, "w:gz") as tar:
    tar.add(source_dir, arcname=os.path.basename(source_dir))

#逐个添加文件打包,未打包空子目录。可过滤文件。
#如果只打包不压缩,将"w:gz"参数改为"w:"或"w"即可。
def make_targz_one_by_one(output_filename, source_dir):
  tar = tarfile.open(output_filename,"w:gz")
  for root,dir,files in os.walk(source_dir):
    for file in files:
      pathfile = os.path.join(root, file)
      tar.add(pathfile)
  tar.close()

make_targz('test.tar.gz',"E:\python_sample\libs")
make_targz_one_by_one('test01.tgz',"E:\python_sample\libs")
  • 解压
import gzip
import os
def un_gz(file_name):
    """ungz zip file"""
    f_name = file_name.replace(".gz", "")
    #获取文件的名称,去掉
    g_file = gzip.GzipFile(file_name)
    #创建gzip对象
    open(f_name, "wb+").write(g_file.read())
    #gzip对象用read()打开后,写入open()建立的文件里。
    g_file.close() #关闭gzip对象

   
import tarfile
def un_tar(file_name):
    #untar zip file
    tar = tarfile.open(file_name)
    names = tar.getnames()
    if os.path.isdir(file_name + "_files"):
        pass
    else:
        os.mkdir(file_name + "_files")
    #由于解压后是许多文件,预先建立同名文件夹
    for name in names:
        tar.extract(name, file_name + "_files/")
    tar.close()
un_gz("test.tar.gz")
un_tar("test.tar")

4.zip

  • 压缩
import os, zipfile
#打包目录为zip文件(未压缩)
def make_zip(source_dir, output_filename):
    zipf = zipfile.ZipFile(output_filename, 'w')
    pre_len = len(os.path.dirname(source_dir))
    for parent, dirnames, filenames in os.walk(source_dir):
        for filename in filenames:
            print(filename)
            pathfile = os.path.join(parent, filename)
            arcname = pathfile[pre_len:].strip(os.path.sep)   #相对路径
            zipf.write(pathfile, arcname)
        print()
    zipf.close()

make_zip(r"E:\python_sample\libs\test_tar_files\libs","test.zip")
  • 解压
import os,zipfile
def un_zip(file_name):
    """unzip zip file"""
    zip_file = zipfile.ZipFile(file_name)
    if os.path.isdir(file_name + "_files"):
        pass
    else:
        os.mkdir(file_name + "_files")
    for names in zip_file.namelist():
        zip_file.extract(names,file_name + "_files/")
    zip_file.close()
un_zip("test.zip")

5.rar

  • 解压
#rarfile不支持创建rar压缩卷,请用zip/7z
import rarfile
def unrar(rar_file, dir_name):
# rarfile需要unrar支持,
# linux下pip install unrar, windows下在winrar文件夹找到unrar,加到path里
rarobj = rarfile.RarFile(rar_file.decode('utf-8'))
rarobj.extractall(dir_name.decode('utf-8'))