图片查重/去重工具是一款专业的图片管理软件,快速识别和处理重复或相似的图片文件。该工具基于感知哈希算法实现图片相似度检测,支持精确重复检测和相似图片查找两种模式
该软件的核心功能包括:通过计算图片的平均哈希值来识别完全相同的图片文件;通过比较哈希差值来发现视觉上相似的图片;支持递归扫描子目录;提供安全的删除确认机制;实时显示处理进度和操作日志。
功能特点
精确重复检测:通过计算图片的平均哈希值,快速识别完全相同的图片文件。无论文件名如何变化,只要图片内容相同,都能被准确识别出来。
相似图片查找:采用感知哈希算法比较图片的视觉特征,可检测出经过压缩、裁剪、调色等处理后的相似图片。用户可自定义相似度阈值(1-20),阈值越小匹配越严格。
双界面支持:
同时提供图形用户界面(GUI)和命令行界面(CLI)。图形界面直观易用,适合普通用户;
命令行界面灵活高效,适合批量处理和自动化脚本。
递归搜索:支持递归扫描子目录,一键查找整个文件夹树中的重复图片,无需手动逐个目录检查。
安全删除机制:删除操作前会显示详细的文件列表供用户确认,图形界面中标记保留和删除的文件,命令行界面需要用户输入确认,防止误删重要文件。
实时进度反馈:处理过程中实时显示进度条和当前处理的文件名,让用户了解任务执行状态。
多格式支持:支持常见的图片格式,包括JPG、JPEG、PNG、BMP、GIF、TIFF、WEBP等。
详细使用说明
图形界面使用说明
图形界面采用标签页设计,主要包含图片查重标签页和关于标签页。
目录选择区域:通过输入框直接输入目录路径,或点击”浏览…”按钮打开文件夹选择对话框。
选项配置区域:
- 查找模式:选择”精确重复”检测完全相同的图片,或”相似图片”检测视觉相似的图片
- 相似度阈值:拖动滑块设置相似度判定标准(仅在相似图片模式下生效),数值越小要求越严格
- 递归搜索子目录:勾选后将扫描所选目录下的所有子文件夹
控制按钮:
- 开始查找:启动扫描任务,扫描期间按钮会变为禁用状态
- 删除选中:删除标记为”[删除]”或”[相似]”的文件,扫描完成后自动启用
- 清除结果:清空当前结果列表,重置界面状态
结果列表区域:以表格形式展示扫描结果,包含状态、文件路径、文件大小、所属分组四列。绿色标记的”[保留]”或”[原始]”文件将被保留,红色标记的”[删除]”或”[相似]”文件为待删除项。
日志区域:底部滚动文本框实时显示操作日志,包括扫描进度、处理结果、错误信息等。
命令行界面使用说明
命令行界面提供完整的参数控制,适合批量处理和脚本集成。
基本参数:
| 参数 | 简写 | 说明 |
|---|---|---|
| —path | -p | 图片目录路径(必填) |
| —recursive | -r | 递归搜索子目录 |
| —delete | -d | 删除重复文件 |
| —no-confirm | -N | 删除时不确认(需与-d一起使用) |
| —similar | -s | 查找相似图片模式 |
| —threshold | -t | 相似度阈值(1-20,默认5) |
| —verbose | -v | 显示详细输出 |
使用示例:
仅显示重复图片(不删除):
python源代码.py -p D:\Photos
递归查找所有子目录:
python源代码.py -r -p D:\Photos
查找并删除重复文件(需确认):
python源代码.py -r -d -p D:\Photos
直接删除不确认(谨慎使用):
python源代码.py -r -d -N -p D:\Photos
查找相似图片(阈值10):
python源代码.py -r -s -t 10 -p D:\Photos
使用场景示例
场景一:整理手机备份照片
用户从手机导出了多年的照片备份,文件夹结构复杂,存在大量重复照片。使用本工具可以快速清理:
- 运行图形界面,选择照片备份根目录
- 勾选”递归搜索子目录”
- 选择”精确重复”模式
- 点击”开始查找”,等待扫描完成
- 检查结果列表,确认无误后点击”删除选中”
- 工具会自动保留每组重复文件中的一个,删除其余副本
场景二:筛选相似素材图片
设计师需要从大量素材中筛选出相似的图片进行整理。这些图片可能经过压缩、裁剪或调色处理:
- 运行图形界面,选择素材文件夹
- 勾选”递归搜索子目录”
- 选择”相似图片”模式
- 根据需要调整相似度阈值(建议从5开始尝试)
- 点击”开始查找”进行扫描
- 查看结果,根据实际相似度调整阈值重新扫描
- 确认后删除不需要的版本
场景三:服务器批量清理重复图片
网站服务器积累了大量用户上传的图片,需要定期清理重复文件以节省存储空间。使用命令行界面可以方便地集成到定时任务中:
# 查看重复图片列表python源代码.py -r -v -p /var/www/uploads/images# 确认后执行删除(需要确认)python源代码.py -r -d -p /var/www/uploads/images# 或集成到脚本中自动执行(不确认)python源代码.py -r -d -N -p /var/www/uploads/images
注意事项
数据备份:在执行删除操作前,强烈建议对重要图片进行备份。虽然工具提供了确认机制,但数据安全始终是首要考虑。
删除不可恢复:文件删除操作是永久性的,无法通过回收站恢复。请务必仔细核对删除列表后再确认操作。
相似度阈值调整:相似图片模式下,阈值设置对结果影响较大。建议先用较小的阈值测试,再根据实际需求调整。
大文件处理:处理大量图片时可能需要较长时间,请耐心等待。图形界面会显示实时进度,命令行可使用-v参数查看详细信息。
文件权限:确保程序对目标目录有读取权限,对需要删除的文件有写入权限。
常见问题解答
Q: 为什么有些明显相同的图片没有被识别为重复?
A: 如果图片经过了重新编码、压缩或格式转换,其哈希值可能会发生变化。建议使用”相似图片”模式,并适当调高阈值。
Q: 删除文件时提示”删除失败”怎么办?
A: 可能原因包括:文件被其他程序占用、文件权限不足、文件路径包含特殊字符等。请关闭可能占用文件的程序,或以管理员权限运行工具。
Q: 相似度阈值应该设置为多少?
A: 默认值5适用于大多数场景。阈值越小匹配越严格(只检测非常相似的图片),阈值越大匹配越宽松(可能检测出不太相似的图片)。建议从默认值开始,根据实际结果调整。
Q: 支持哪些图片格式?
A: 支持JPG、JPEG、PNG、BMP、GIF、TIFF、WEBP等常见格式。对于不支持的格式,程序会跳过并记录日志。
Q: 删除时会保留哪个文件?
A: 每组重复文件中,程序会保留文件名排序后的第一个文件,其余文件标记为待删除。可以在图形界面中查看具体标记。
程序使用环境及相关说明
1、适用的系统环境说明: win7及以上64位win操作系统 , 注意事项:win32位系统以及mac系统需要额外定制开发
2、关于使用限制:①无需注册、登录等限制,直接使用, ②没有电脑台数限制, ③无使用时间限制、不联网本地使用、确保数据安全
3、程序如何安装:不需要安装,按照说明使用即可。
特别注意:请先测试,注意备份原文件,之后再批量使用,避免不可逆损失。
程序使用说明
本工具下载地址
更新日志
V1.0
- 随机文章
- 热门文章
- 714-批量按指定数量分割源文件夹下文件到目标文件夹下
- 717-搜索指定文件夹下同名文件【包含子孙文件夹下文件】在目标文件夹下创建同名文件夹并将同名文件移入
- 727-根据txt内文件夹名搜索指定文件夹并移动文件夹到以txt文件名创建的文件夹内
- 766-移动带有关键字文件到指定文件夹
- 777-根据文件创建时间修改时间先后对每个文件夹下所有文件进行排序
- 789-批量检测指定文件夹下空文件夹并输出到txt
- 使用docsify配合github搭建个人知识库
- 批量复制指定文件夹下文件夹结构到目标文件夹内
- 10081-2-批量解压自解压文件-批量解压到自解压文件所在文件夹内-不支持密码-除自解压文件外不能有其他exe文件
- 10082-1-批量解压压缩包-【支持子文件夹穿透】【不支持密码解压-多层嵌套压缩包解压】







还没有评论,来说两句吧...