原标题:10034-批量图片去重复-支持子孙文件夹下操作-使用局部敏感哈希和感知哈希结合的方法进行图片去重【带界面-源代码】
导读:
基于Python的图片重复检测与删除工具这段代码实现了一个专门运行在64位Windows系统(Win7及以上)的图形化工具,它的主要功能是批量检测并删除指定文件夹及其子文件夹...
基于Python的图片重复检测与删除工具
这段代码实现了一个专门运行在64位Windows系统(Win7及以上)的图形化工具,它的主要功能是批量检测并删除指定文件夹及其子文件夹内的重复图片,仅保留一张。该工具支持多种常见图片格式,包括 .jpg
、.jpeg
、.png
、.gif
、.bmp
、.tiff
和 .webp
。
用户打开这个工具后,首先看到的是详细的程序介绍,涵盖了工具适用的系统、支持的文件格式、对文件夹的穿透能力、具体功能、相似度阈值的使用说明以及实际使用的示例。在操作界面,用户需要执行以下操作:
- 选择图片所在文件夹路径:点击“选择文件夹”按钮,指定包含待检测图片的文件夹路径。工具会自动遍历该文件夹及其所有子文件夹中的图片。
- 设置相似度阈值:在“相似度阈值(推荐范围:10 - 20)”输入框中输入一个数字。这个阈值用于判断图片之间的相似程度,数字越大判断越严谨,一般推荐输入10,如果想要更严格的判断可以适当增加数值,但通常建议在10 - 20的范围内,具体数值需要用户自行测试。
完成上述设置后,点击“开始程序”按钮,工具会在一个新线程中启动检测与删除重复图片的任务。在处理过程中,工具会遍历指定文件夹及其子文件夹中的每一张图片,对每张图片分别计算其平均哈希值(LSH哈希)和感知哈希值。然后将当前图片的哈希值与已经记录的图片哈希值进行比较,如果与某张已记录图片的两种哈希值差异都小于设定的相似度阈值,就认为这两张图片是重复的,会删除当前图片,并在日志框中记录相关信息。如果在处理过程中用户点击“结束任务”按钮,工具会停止操作,并在日志框中记录“操作已终止”。处理完成后,日志框会显示“操作完成”,同时相关按钮状态会恢复到初始状态。
此外,工具还提供了“清空输入框”和“清空日志”按钮。“清空输入框”按钮可以清除文件夹路径和相似度阈值输入框中的内容;“清空日志”按钮则用于清空日志框中的所有记录。
菜单栏中有两个选项,“更多程序介绍”会打开一个特定链接,提供更多关于程序的详细信息;“win/mac程序定制”则显示了程序定制的联系方式,包括微信号以及定制费用说明。
以下是实例验证: 假设存在如下文件夹结构:
主文件夹
│
├── 图片文件夹
│ ├── img1.jpg
│ ├── img2.png
│ ├── 子文件夹 1
│ │ ├── img3.jpeg(与 img1.jpg 重复)
│ │ └── img4.bmp
│ ├── 子文件夹 2
│ │ ├── img5.gif
│ │ └── img6.webp(与 img2.png 重复)
打开该工具,选择“图片文件夹”路径为“主文件夹/图片文件夹”,在“相似度阈值(推荐范围:10 - 20)”输入框中输入“10”,然后点击“开始程序”。工具会遍历“图片文件夹”及其子文件夹中的所有图片,检测并删除重复的 img3.jpeg
和 img6.webp
,同时在日志框中记录操作信息。若在处理过程中点击“结束任务”按钮,可中断处理任务。
python版本:3.86
是否带UI界面:UI版本
电脑系统版本:win10 64位 专业版系统(这是测试环境,其他环境也可以32位操作系统可能需要调整代码,让AI去转换即可)
脚本使用到的库:使用pycharm编辑器,如果没有安装相关库,会自动标红提示,鼠标放到标红的地方会弹出安装库按钮
重要提示:这是源代码,需要安装python使用,也可以自行修改部分代码实现想要的功能
查看源代码
- 随机文章
- 热门文章
- 704-获取A文件夹下各文件夹下的图片数量输出到excell
- 709-监测指定文件夹修改文件名为所在文件夹名称并移动到指定文件夹下
- 726-批量删除指定文件夹下及子孙文件夹下所有文件-不删除文件夹及空文件夹
- 754-批量根据excelA-B列内容移动文件到目标文件夹
- 761-统计指定文件夹及其子文件夹中每种文件类型的数量
- 785-批量重命指定文件夹内所有文件-指定名称+数字序列…形式
- 454-批量检测损坏pdf文件并移动到目标文件夹内
- Windows 启用长路径支持
- 10084-批量解压7z分卷-【支持带密码的分卷-子文件夹穿透】【不支持多层嵌套分卷】
- 101-m3u8链接解析下载工具-可一次输入多个m3u8链接
- 1开通VIP会员享全站内容免费查看
- 2🔥🔥🔥承接各种批处理工具定制 / 售后相关信息 / 任何需求请在该文章下留言
- 3752-批量复制文件及文件夹到多个文件夹
- 410081-1-批量解压自解压文件-【支持密码-子文件穿透】【不支持嵌套自解压或压缩包解压】-除自解压文件外不能有其他exe文件
- 5790-批量统计各文件夹下文件类型数量及文件夹路径输出到excell
- 6网页插入bilibili哔哩哔哩视频
- 7401-批量识别pdf中二维码并替换为指定图片或覆盖白色
- 8431-批量合并指定文件夹下各文件夹内pdf为一个pdf文件
- 9Adobe程序完全卸载教程完全卸载无残留-【包括单个程序卸载和全部程序卸载】(win系统版本)
- 10为ps脚本添加快捷键快速调用
还没有评论,来说两句吧...