首页 > python-----利用filecmp删除重复文件

python-----利用filecmp删除重复文件

以下代码素材自取:链接:https://pan.baidu.com/s/1fL17RjKyGjpvpeeUFONCaQ  提取码:zgiw

# coding:utf-8
import os
import filecmp# 将指定目录下的所有文件的路径存储到all_files变量中
def get_all_files(path, dirs):all_files = []for d in dirs:cur_path = os.path.join(path, d)files = os.listdir(cur_path)for f in files:all_files.append(os.path.join(cur_path, f))return all_files# 比较两个文件的内容是否一致
def cmp_files(x, y):if filecmp.cmp(x, y):# 如果一致,则删除第二个,保留第一个,并输出信息
        os.remove(y)print("路径"" + y + ""下的文件是重复文件,已经删除")if __name__ == '__main__':# 需要把路径替换成你的文件夹所在路径,当把这个代码文件放在要处理的文件夹外一层时,可以使用下面的相对路径写法path = r'F:	empproblem3_files'# 已知路径下存在两个文件夹pic1和pic2dirs = ['pic1', 'pic2']# 调用函数,获取文件列表all_files = get_all_files(path, dirs)# 用双重for循环来比较文件是否有重复for x in all_files:for y in all_files:# 如果x和y不是相同的文件,而且都存在,则执行后续操作if x != y and os.path.exists(x) and os.path.exists(y):# 比较两个文件的内容是否一致cmp_files(x,y)

 

转载于:https://www.cnblogs.com/xiaodai0/p/10309841.html

更多相关:

  • 本文来自 运维人生 ,作者:fly是个稻草人链接:http://www.ywadmin.com/?id=76误删除linux系统文件了?不用急,本文将给你一个恢复linux文件的方法,让你轻松应对运维中的各风险问题。方法总比问题多~说在前面的话针对日常维护操作,难免会出现文件误删除的操作。大家熟知linux文件系统不同win有回收...

  • 原文来自SecIN社区—作者:WiHat0x00 什么是WebShell渗透测试工作的一个阶段性目标就是获取目标服务器的操作控制权限,于是WebShell便应运而生。Webshell中的WEB就是web服务,shell就是管理攻击者与操作系统之间的交互。Webshell被称为攻击者通过Web服务器端口对Web服务器有一定的操作权限,而...

  • 断电时文件系统发生了什么?硬盘又发生了什么?下一次开机时写到一半的文件在系统层面还在吗?在底层还在吗?更进一步的, 文件系统如何保证事务性, 会不会存在某种极端情况导致例如最后几个bit还没写完, 文件系统却认为它成功了的情况?回答不限任何文件系统,谢谢!下面是「北极」的回复分享断电的一瞬间,很多事情是无法确定的:1. 你无法确定...

  • 接到项目需求。需要搭建一个页面进行交互,慢慢来b (2).jpg使用python django框架进行页面的搭建在项目文件下打开窗口,输入命令;django-admin startproject helloword#在文件helloword/helloword/创建view.py在view.py文件中输入以代码from django....

  • 常见的错误集合解决方案(一)No.1提示错误'Microsoft.VC90.CRT,version="9.0.21022.8"把Microsoft.NET Framework 3.5.1下面的全部勾选上。No.2解决Qt Designer设计的图标但是VS生成不显示问题描述:在Qt designer中为菜单栏和工具栏设计的图标,但是...

  • 1. 新建用户 root@ubuntu:~# adduser hadoop root@ubuntu:~# passwd hadoop #为hadoop用户设置密码 2. 为hadoop用户添加sudo权限 root@ubuntu:~# sudo gedit /etc/sudoers 把root那行复制后改成hadoop,had...