快速识别和清理重复图片文件,采用图像哈希算法和结构相似性分析技术,能够准确检测出高度相似的图片,并根据用户需求进行删除或移动操作。
软件核心功能包括:支持多种常见图片格式的识别、基于LSH哈希和感知哈希的快速相似度检测、结构相似性指数(SSIM)精确验证、ORB局部特征匹配补充判定,以及灵活的重复图片处理策略。
重要说明(使用前请先测试找到适合自己文件的值),
除了第一个默认10参数调整外其他默认即可,其他参数也可以微调,一般建议默认即可
如下图所示,最右侧的两张图片微小的差距(只有部分字体变化,其他大部分相同),如果使用默认值10,则会删除其中一个,但是如果使用1-3之间的任意数值,都会完整保留,所以这个需要多做测试,才能明白哪个值适合自己,可以先使用默认值进行测试,然后使用5或15进行对比,几分钟测试完成后再大批量使用。测试时不需要太多文件,几十个即可。
功能特点
多格式图片支持:'.jpg', '.jpeg', '.png', '.gif', '.bmp', '.tiff', '.webp'
双重哈希检测:结合LSH哈希和感知哈希算法,实现快速高效的相似图片初筛,大幅提升处理速度
SSIM精确验证:使用结构相似性指数对初筛结果进行精确验证,确保判定结果的准确性
ORB特征匹配:提供ORB局部特征匹配作为补充判定手段,有效处理旋转、缩放等变换情况
灵活处理模式:支持直接删除重复图片或移动到待确认目录两种模式,满足不同使用场景需求
全局/局部比较:可选择在单个文件夹内去重或跨文件夹全局去重,适应不同的文件组织结构
可中断操作:支持随时中断处理过程,避免长时间等待
映射记录保存:自动保存移动文件的原始路径映射,便于后续追溯和恢复
快速开始
启动程序:运行程序
选择目标文件夹:点击”选择文件夹”按钮,选择需要去重的图片文件夹
设置相似度阈值:
- 哈希相似度阈值:默认10,数值越小判定越严格
- SSIM阈值:默认0.98,数值越大判定越严格
- ORB匹配率阈值:默认0.7,数值越大判定越严格
选择处理模式:
- 勾选”仅移动不删除”:将重复图片移动到”待确认重复图片”文件夹
- 不勾选:直接删除重复图片
开始处理:点击”开始去重”按钮,程序将自动扫描并处理重复图片
查看结果:在日志窗口中实时查看处理进度和结果
参数设置详解
哈希相似度阈值
该参数控制初筛阶段的严格程度。程序使用LSH哈希和感知哈希两种算法计算图片的哈希值,通过比较哈希距离判断图片是否相似。
- 设置范围:1-20
- 默认值:10
- 建议:对于要求宽松的场景,设置为1-10;对于严格场景,可设置为10-20
SSIM阈值
该参数用于精确验证阶段,通过计算结构相似性指数进一步确认图片是否重复。
- 设置范围:0-1
- 默认值:0.95
- 建议:0.90-0.98之间,数值越大判定越严格
ORB匹配率阈值
当SSIM判定不确定时,使用ORB局部特征匹配进行补充判定。
- 设置范围:0-1
- 默认值:0.7
- 建议:0.7,根据实际效果调整
处理模式说明
仅移动不删除模式
勾选此选项后,程序不会直接删除重复图片,而是将其移动到”待确认重复图片”文件夹中。
该文件夹会保持原始的相对路径结构,便于用户确认后手动处理。
程序会自动创建.quarantine_map.json文件,记录移动文件的原始路径映射关系,方便后续追溯。
直接删除模式
不勾选”仅移动不删除”选项时,程序将直接删除检测到的重复图片。
此模式操作不可逆,请谨慎使用。
建议首次使用时先启用”仅移动不删除”模式,确认结果无误后再使用直接删除模式。
全局比较模式
启用”全局比较”选项后,程序将在所有子文件夹之间进行跨文件夹去重。禁用时,每个子文件夹独立进行去重,不会跨文件夹比较。
全局比较模式适用于需要在不同文件夹间去重的场景,但处理时间会相应增加。
使用场景示例
场景一:清理相机照片文件夹
问题描述:用户将多张SD卡的照片复制到同一文件夹,导致大量重复照片,需要清理。
操作步骤:
- 启动程序,点击”选择文件夹”按钮,选择照片存储文件夹
- 设置哈希相似度阈值为5
- 设置SSIM阈值为0.98
- 勾选”仅移动不删除”选项
- 点击”开始去重”按钮
- 等待处理完成,查看日志确认结果
- 检查”待确认重复图片”文件夹中的内容
- 确认无误后,可再次运行程序并取消勾选”仅移动不删除”,直接删除重复图片
预期结果:程序将识别出完全相同或高度相似的照片,移动到待确认文件夹,释放大量存储空间。
场景二:整理设计素材库
问题描述:设计师的素材文件夹中存在大量相似的设计稿和素材,需要整理去重。
操作步骤:
- 启动程序,选择素材文件夹
- 设置哈希相似度阈值为15
- 设置SSIM阈值为0.92
- 设置ORB匹配率阈值为0.25
- 启用”全局比较”选项,跨子文件夹去重
- 勾选”仅移动不删除”选项
- 点击”开始去重”按钮
- 处理完成后,检查待确认文件夹中的素材
- 根据需要保留或删除重复素材
预期结果:程序将识别出相似的设计稿,帮助设计师快速整理素材库,提高工作效率。
场景三:批量处理多个项目文件夹
问题描述:用户有多个项目文件夹,每个文件夹都需要单独去重,但不想跨文件夹比较。
操作步骤:
- 启动程序,选择第一个项目文件夹
- 设置合适的相似度阈值(如哈希10、SSIM 0.95)
- 不勾选”全局比较”选项
- 不勾选”仅移动不删除”选项(确认无误后)
- 点击”开始去重”按钮
- 等待第一个文件夹处理完成
- 重复步骤1-6,处理其他项目文件夹
预期结果:每个项目文件夹独立进行去重,互不干扰,确保各项目的图片资源保持独立。
注意事项
数据安全警告:使用直接删除模式时,重复图片将被永久删除,无法恢复。建议首次使用时始终启用”仅移动不删除”模式,确认结果无误后再使用删除模式。
备份重要数据:在处理重要图片文件夹前,建议先创建完整备份,以防意外数据丢失。
中文路径支持:程序已优化中文路径处理,但建议避免使用特殊字符和过长的文件名,以确保兼容性。
处理时间预估:处理时间取决于图片数量、大小和设置的阈值。大型文件夹可能需要较长时间,请耐心等待。
内存占用:处理大量高分辨率图片时,程序可能占用较多内存。如遇到内存不足问题,建议分批处理。
待确认文件夹:程序会自动创建”待确认重复图片”文件夹,请勿手动修改该文件夹内容,以免影响映射记录。
映射文件保护:
.quarantine_map.json文件记录了移动文件的原始路径,请勿删除或修改该文件。中断处理:如需中断处理过程,点击”停止”按钮即可。程序会安全停止当前操作。
阈值调整建议:首次使用建议使用默认阈值,根据实际效果逐步调整。过低的阈值可能导致漏判,过高的阈值可能导致误判。
程序截图
常见问题解答
Q: 处理速度很慢,如何提升效率?
A: 可以通过以下方式提升处理速度:
- 适当提高或降低哈希相似度阈值(如从10提高到15)
- 禁用”全局比较”选项,避免跨文件夹比较
- 关闭其他占用系统资源的程序
- 分批处理大型文件夹
Q: 为什么有些相似的图片没有被检测出来?
A: 可能的原因包括:
- 相似度阈值设置过高,建议降低阈值
- 图片经过了旋转、裁剪等变换,建议提高ORB匹配率阈值
- 图片质量差异较大,建议降低SSIM阈值
Q: 为什么有些不相似的图片被判定为重复?
A: 可能的原因包括:
- 相似度阈值设置过低,建议提高阈值
- 图片内容确实高度相似,请仔细检查
- 可以尝试提高SSIM阈值,使用更严格的判定标准
Q: 待确认文件夹中的图片如何恢复到原位置?
A: 程序会自动生成.quarantine_map.json文件记录原始路径映射。如需恢复,可以手动根据映射信息将文件移回原位置,或重新运行程序并调整参数。
Q: 支持哪些图片格式?
A: 程序支持以下常见图片格式:JPG、JPEG、PNG、GIF、BMP、TIFF、WEBP。其他格式可能无法正确识别和处理。
Q: 可以处理网络图片吗?
A: 不可以。程序只能处理本地存储的图片文件。如需处理网络图片,请先下载到本地文件夹。
Q: 处理过程中程序卡死怎么办?
A: 首先尝试点击”停止”按钮中断处理。如无法响应,请关闭程序窗口。程序已设计为安全中断,不会损坏数据。
Q: 可以同时处理多个文件夹吗?
A: 可以。比如A文件夹下有多个文件夹,输入A文件夹路径即可,如果跨文件夹对比则勾选选项即可,不跨文件夹则不勾选
Q: 程序会修改原始图片吗?
A: 不会。程序只会删除或移动重复图片,不会对原始图片内容进行任何修改。
Q: 如何判断应该使用什么阈值?
A: 建议从默认值开始,根据实际效果调整(下方值仅做参考):
- 严格去重:哈希5、SSIM 0.98
- 标准去重:哈希10、SSIM 0.95(默认)
- 宽松去重:哈希15、SSIM 0.92
Q: 程序支持批量处理吗?
A: 程序会自动处理选定文件夹及其子文件夹中的所有图片,无需手动选择单个文件。
Q: 处理大量图片时内存不足怎么办?
A: 可以尝试以下方法:
- 关闭其他占用内存的程序
- 分批处理大型文件夹
- 降低图片处理质量(通过调整参数)
程序使用环境及相关说明
1、适用的系统环境说明: win7及以上64位win操作系统 , 注意事项:win32位系统以及mac系统需要额外定制开发
2、关于使用限制:①无需注册、登录等限制,直接使用, ②没有电脑台数限制, ③无使用时间限制、不联网本地使用、确保数据安全
3、程序如何安装:不需要安装,按照说明使用即可。
特别注意:请先测试,注意备份原文件,之后再批量使用,避免不可逆损失。
程序使用说明
本工具下载地址
更新日志
V3.0
- 随机文章
- 热门文章
- 727-根据txt内文件夹名搜索指定文件夹并移动文件夹到以txt文件名创建的文件夹内
- 758-一键按照时间-按月份-按日期-文件类型-修改时间整理文件
- 784-批量搜索移动或复制指定文件夹下指定名称的指定格式的文件到指定文件夹
- win系统可以安全删除的文件夹-以清理释放系统空间
- 搜索A文件夹内与B文件夹下快捷方式指向的最后一个文件夹同名文件夹并移动文件夹到快捷方式所在文件夹下
- 批量复制指定文件夹下文件夹结构到目标文件夹内
- 791-批量为文件夹名添加前缀或后缀
- 110-批量使用视频第几秒的第一帧设置视频封面
- 112-批量缩放mp4视频到指定720-1080尺寸
- 10046-2-批量为视频左上角添加图片水印可设置水印透明度
- 1开通VIP会员享全站内容免费查看
- 2🔥🔥🔥常见问题 | 售后问题 | 程序购买 | 会员开通等问题
- 3AI工具箱整理-202508
- 4752-批量复制文件及文件夹到多个文件夹
- 510081-1-批量解压自解压文件-【支持密码-子文件穿透】【不支持嵌套自解压或压缩包解压】-除自解压文件外不能有其他exe文件
- 6790-批量统计各文件夹下文件类型数量及文件夹路径输出到excell
- 7790批量将每个文件夹下图片分别合并为一个word文档
- 8794批量获取excell工作表名称并写入txt文档
- 9从输入路径所在文件夹名开始,对输入路径下所有文件名前添加所在文件夹名
- 10791批量将指定文件夹A下最后一层文件夹内文件提取到A文件夹根目录下









还没有评论,来说两句吧...