压缩和解压缩是日常常用的操作,不管是windows上图形界面的操作,还是linux上用命令来进行压缩解压缩,总的而言都还是比较方便的。
但用代码来实现就没做过,近期也得实现代码压缩与解压缩操作,所以就抽时间来研究一下。

一、zip文件压缩和解压缩实现

import
os

import
zipfile



# 函数功能是zip_file_list所有文件,和zip_dir_list所有目录下的所有文件,被压缩到一个zip_file_name的压缩文件中
defmy_zip_function
(
zip_file_name, zip_file_list=[], zip_dir_list=[]
):

# 压缩文件最后需要close,为了方便我们直接用with
with
zipfile.ZipFile(zip_file_name,
"w"
)
as
zip_obj:

# 压缩文件
for
tmp_file
in
zip_file_list:

zip_obj.write(tmp_file)

# 压缩目录
for
tmp_dir
in
zip_dir_list:

# zipfile没有直接压缩目录的功能,要压缩目录只能遍历目录一个一个文件压。
for
root, dirs, files
in
os.walk(tmp_dir):

# 如果想要目录为空时仍将该目录压缩进去,该目录也要压缩一遍;反之请将以下行注释掉
zip_obj.write(root)

for
tmp_file
in
files:

# 拼接文件完整目录,不然只用文件名代码找不到文件
tmp_file_path = os.path.join(root, tmp_file)

zip_obj.write(tmp_file_path)



# 函数功能是遍历压缩文件中的所有文件
defmy_traversal_zip_function
(
zip_file_name
):

with
zipfile.ZipFile(zip_file_name,
"r"
)
as
zip_obj:

# 返回结果是一个ZipInfo列表
# 如果在压缩时显示压缩目录,则目录也作为一个单独的ZipInfo呈现在列表中;反之则没有目录的ZipInfo
all_file_list = zip_obj.infolist()

for
tmp_file
in
all_file_list:

print
(tmp_file.filename)

# 还可以在不解压的情况下直接读取文件的内容
# 可以通过ZipInfo.is_dir()来区分是文件还是目录
# if not tmp_file.is_dir():
# with zip_obj.open(tmp_file) as zip_fd:
# print(zip_fd.read())


# 函数的功能是将压缩文件直接解压
defmy_unzip_function
(
zip_file_name, path="."
):

with
zipfile.ZipFile(zip_file_name,
"r"
)
as
zip_obj:

zip_obj.extractall(path=path)



if
__name__ ==
"__main__"
:

zip_file_name =
"test_zip.zip"
# 自己在测试时要先自行创建好要压缩的文件和目录
zip_file_list = [
"test_tar_file1.txt"
,
"test_tar_file2.txt"
]

zip_dir_list = [
"test_tar_dir"
]

my_zip_function(zip_file_name, zip_file_list, zip_dir_list)

my_traversal_zip_function(zip_file_name)

# my_unzip_function(zip_file_name, path=".")

二、tar文件的压缩与解压缩实现

除了直接的.tar文件,还包括.tar.gz/.tar.bz2/.tar.xz等格式文件的压缩与解压缩实现。
import
os

import
tarfile



# 函数功能是tar_file_list所有文件,和tar_dir_list所有目录下的所有文件,被压缩到一个tar_file_name的压缩文件中
defmy_tar_function
(
tar_file_name, tar_file_list=[], tar_dir_list=[], model="w"
):

# 本来也应该是tarfile.TarFile(tar_file_name, model)来创建的,但TarFile不支持"r:gz"等扩展形式
# 压缩文件最后需要close,为了方便我们直接用with
with
tarfile.
open
(tar_file_name, model)
as
tar_obj:

# 压缩文件
for
tmp_file
in
tar_file_list:

tar_obj.add(tmp_file)

# 压缩目录。和zipfile相比tarfile允许直接压缩目录,而不需要去遍历目录一个个文件压
for
tmp_dir
in
tar_dir_list:

tar_obj.add(tmp_dir)



# 函数功能是遍历压缩文件中的所有文件
defmy_traversal_tar_function
(
tar_file_name, model="r"
):

with
tarfile.
open
(tar_file_name, model)
as
tar_obj:

# 返回结果是一个TarInfo列表
all_file_list = tar_obj.getmembers()

for
tmp_file
in
all_file_list:

print
(tmp_file.name)

# 还可以在不解压的情况下直接读取文件的内容
# 可以通过TarInfo.isdir()来区分是文件还是目录
# if not tmp_file.isdir():
# # 相当于zip的open,并不会把文件给解压出来
# tar_fd = tar_obj.extractfile(tmp_file)
# print(tar_fd.read())


# 函数的功能是将压缩文件直接解压
defmy_untar_function
(
tar_file_name, path=".", model="r"
):

with
tarfile.
open
(tar_file_name, model)
as
tar_obj:

tar_obj.extractall(path=path)


#学习中遇到问题没人解答?小编创建了一个Python学习交流群:153708845
if
__name__ ==
"__main__"
:

# 自己在测试时要先自行创建好要压缩的文件和目录
tar_file_list = [
"test_tar_file1.txt"
,
"test_tar_file2.txt"
]

tar_dir_list = [
"test_tar_dir"
]

tar_file_name =
"test_tar.tar"
# 在.tar基础上,tarfile还支持gz/bz2/xz的压缩,只要在原来打开模式的基础上使用:或|接上压缩方法即可,如"r:gz"
# 特别的,如果是读取文件,可以使用"r:*"来指示尝试以任意格式读取
open_model =
"w"
# open_model = "w:gz"
my_tar_function(tar_file_name, tar_file_list, tar_dir_list, model=open_model)

open_model =
"r"
# open_model = "r:*"
my_traversal_tar_function(tar_file_name, model=open_model)

# open_model = "r:*"
# my_untar_function(tar_file_name, path=".", model=open_model)
链接:https://www.cnblogs.com/djdjdj123/p/18124124
(版权归原作者所有,侵删)
继续阅读
阅读原文