878-批量图片去重工具-每个文件夹单独处理-支持子孙文件夹下操作-V3.0

快速识别和清理重复图片文件,采用图像哈希算法和结构相似性分析技术,能够准确检测出高度相似的图片,并根据用户需求进行删除或移动操作。

软件核心功能包括:支持多种常见图片格式的识别、基于LSH哈希和感知哈希的快速相似度检测、结构相似性指数(SSIM)精确验证、ORB局部特征匹配补充判定,以及灵活的重复图片处理策略。

878-批量图片去重工具-每个文件夹单独处理-支持子孙文件夹下操作-V3.0

重要说明(使用前请先测试找到适合自己文件的值),

除了第一个默认10参数调整外其他默认即可,其他参数也可以微调,一般建议默认即可

如下图所示,最右侧的两张图片微小的差距(只有部分字体变化,其他大部分相同),如果使用默认值10,则会删除其中一个,但是如果使用1-3之间的任意数值,都会完整保留,所以这个需要多做测试,才能明白哪个值适合自己,可以先使用默认值进行测试,然后使用5或15进行对比,几分钟测试完成后再大批量使用。测试时不需要太多文件,几十个即可。

878-批量图片去重工具-每个文件夹单独处理-支持子孙文件夹下操作-V3.0

功能特点

  • 多格式图片支持:'.jpg', '.jpeg', '.png', '.gif', '.bmp', '.tiff', '.webp'

  • 双重哈希检测:结合LSH哈希和感知哈希算法,实现快速高效的相似图片初筛,大幅提升处理速度

  • SSIM精确验证:使用结构相似性指数对初筛结果进行精确验证,确保判定结果的准确性

  • ORB特征匹配:提供ORB局部特征匹配作为补充判定手段,有效处理旋转、缩放等变换情况

  • 灵活处理模式:支持直接删除重复图片或移动到待确认目录两种模式,满足不同使用场景需求

  • 全局/局部比较:可选择在单个文件夹内去重或跨文件夹全局去重,适应不同的文件组织结构

  • 可中断操作:支持随时中断处理过程,避免长时间等待

  • 映射记录保存:自动保存移动文件的原始路径映射,便于后续追溯和恢复

快速开始

  1. 启动程序:运行程序

  2. 选择目标文件夹:点击”选择文件夹”按钮,选择需要去重的图片文件夹

  3. 设置相似度阈值:

    • 哈希相似度阈值:默认10,数值越小判定越严格
    • SSIM阈值:默认0.98,数值越大判定越严格
    • ORB匹配率阈值:默认0.7,数值越大判定越严格
  4. 选择处理模式:

    • 勾选”仅移动不删除”:将重复图片移动到”待确认重复图片”文件夹
    • 不勾选:直接删除重复图片
  5. 开始处理:点击”开始去重”按钮,程序将自动扫描并处理重复图片

  6. 查看结果:在日志窗口中实时查看处理进度和结果

878-批量图片去重工具-每个文件夹单独处理-支持子孙文件夹下操作-V3.0

参数设置详解

哈希相似度阈值

该参数控制初筛阶段的严格程度。程序使用LSH哈希和感知哈希两种算法计算图片的哈希值,通过比较哈希距离判断图片是否相似。

  • 设置范围:1-20
  • 默认值:10
  • 建议:对于要求宽松的场景,设置为1-10;对于严格场景,可设置为10-20

SSIM阈值

该参数用于精确验证阶段,通过计算结构相似性指数进一步确认图片是否重复。

  • 设置范围:0-1
  • 默认值:0.95
  • 建议:0.90-0.98之间,数值越大判定越严格

ORB匹配率阈值

当SSIM判定不确定时,使用ORB局部特征匹配进行补充判定。

  • 设置范围:0-1
  • 默认值:0.7
  • 建议:0.7,根据实际效果调整

处理模式说明

仅移动不删除模式

勾选此选项后,程序不会直接删除重复图片,而是将其移动到”待确认重复图片”文件夹中。

该文件夹会保持原始的相对路径结构,便于用户确认后手动处理。

程序会自动创建.quarantine_map.json文件,记录移动文件的原始路径映射关系,方便后续追溯。

直接删除模式

不勾选”仅移动不删除”选项时,程序将直接删除检测到的重复图片。

此模式操作不可逆,请谨慎使用。

建议首次使用时先启用”仅移动不删除”模式,确认结果无误后再使用直接删除模式。

全局比较模式

启用”全局比较”选项后,程序将在所有子文件夹之间进行跨文件夹去重。禁用时,每个子文件夹独立进行去重,不会跨文件夹比较。

全局比较模式适用于需要在不同文件夹间去重的场景,但处理时间会相应增加。

使用场景示例

场景一:清理相机照片文件夹

问题描述:用户将多张SD卡的照片复制到同一文件夹,导致大量重复照片,需要清理。

操作步骤

  1. 启动程序,点击”选择文件夹”按钮,选择照片存储文件夹
  2. 设置哈希相似度阈值为5
  3. 设置SSIM阈值为0.98
  4. 勾选”仅移动不删除”选项
  5. 点击”开始去重”按钮
  6. 等待处理完成,查看日志确认结果
  7. 检查”待确认重复图片”文件夹中的内容
  8. 确认无误后,可再次运行程序并取消勾选”仅移动不删除”,直接删除重复图片

预期结果:程序将识别出完全相同或高度相似的照片,移动到待确认文件夹,释放大量存储空间。

场景二:整理设计素材库

问题描述:设计师的素材文件夹中存在大量相似的设计稿和素材,需要整理去重。

操作步骤

  1. 启动程序,选择素材文件夹
  2. 设置哈希相似度阈值为15
  3. 设置SSIM阈值为0.92
  4. 设置ORB匹配率阈值为0.25
  5. 启用”全局比较”选项,跨子文件夹去重
  6. 勾选”仅移动不删除”选项
  7. 点击”开始去重”按钮
  8. 处理完成后,检查待确认文件夹中的素材
  9. 根据需要保留或删除重复素材

预期结果:程序将识别出相似的设计稿,帮助设计师快速整理素材库,提高工作效率。

场景三:批量处理多个项目文件夹

问题描述:用户有多个项目文件夹,每个文件夹都需要单独去重,但不想跨文件夹比较。

操作步骤

  1. 启动程序,选择第一个项目文件夹
  2. 设置合适的相似度阈值(如哈希10、SSIM 0.95)
  3. 不勾选”全局比较”选项
  4. 不勾选”仅移动不删除”选项(确认无误后)
  5. 点击”开始去重”按钮
  6. 等待第一个文件夹处理完成
  7. 重复步骤1-6,处理其他项目文件夹

预期结果:每个项目文件夹独立进行去重,互不干扰,确保各项目的图片资源保持独立。

注意事项

  • 数据安全警告:使用直接删除模式时,重复图片将被永久删除,无法恢复。建议首次使用时始终启用”仅移动不删除”模式,确认结果无误后再使用删除模式。

  • 备份重要数据:在处理重要图片文件夹前,建议先创建完整备份,以防意外数据丢失。

  • 中文路径支持:程序已优化中文路径处理,但建议避免使用特殊字符和过长的文件名,以确保兼容性。

  • 处理时间预估:处理时间取决于图片数量、大小和设置的阈值。大型文件夹可能需要较长时间,请耐心等待。

  • 内存占用:处理大量高分辨率图片时,程序可能占用较多内存。如遇到内存不足问题,建议分批处理。

  • 待确认文件夹:程序会自动创建”待确认重复图片”文件夹,请勿手动修改该文件夹内容,以免影响映射记录。

  • 映射文件保护:.quarantine_map.json文件记录了移动文件的原始路径,请勿删除或修改该文件。

  • 中断处理:如需中断处理过程,点击”停止”按钮即可。程序会安全停止当前操作。

  • 阈值调整建议:首次使用建议使用默认阈值,根据实际效果逐步调整。过低的阈值可能导致漏判,过高的阈值可能导致误判。

程序截图

878-批量图片去重工具-每个文件夹单独处理-支持子孙文件夹下操作-V3.0

常见问题解答

Q: 处理速度很慢,如何提升效率?

A: 可以通过以下方式提升处理速度:

  1. 适当提高或降低哈希相似度阈值(如从10提高到15)
  2. 禁用”全局比较”选项,避免跨文件夹比较
  3. 关闭其他占用系统资源的程序
  4. 分批处理大型文件夹

Q: 为什么有些相似的图片没有被检测出来?

A: 可能的原因包括:

  1. 相似度阈值设置过高,建议降低阈值
  2. 图片经过了旋转、裁剪等变换,建议提高ORB匹配率阈值
  3. 图片质量差异较大,建议降低SSIM阈值

Q: 为什么有些不相似的图片被判定为重复?

A: 可能的原因包括:

  1. 相似度阈值设置过低,建议提高阈值
  2. 图片内容确实高度相似,请仔细检查
  3. 可以尝试提高SSIM阈值,使用更严格的判定标准

Q: 待确认文件夹中的图片如何恢复到原位置?

A: 程序会自动生成.quarantine_map.json文件记录原始路径映射。如需恢复,可以手动根据映射信息将文件移回原位置,或重新运行程序并调整参数。

Q: 支持哪些图片格式?

A: 程序支持以下常见图片格式:JPG、JPEG、PNG、GIF、BMP、TIFF、WEBP。其他格式可能无法正确识别和处理。

Q: 可以处理网络图片吗?

A: 不可以。程序只能处理本地存储的图片文件。如需处理网络图片,请先下载到本地文件夹。

Q: 处理过程中程序卡死怎么办?

A: 首先尝试点击”停止”按钮中断处理。如无法响应,请关闭程序窗口。程序已设计为安全中断,不会损坏数据。

Q: 可以同时处理多个文件夹吗?

A: 可以。比如A文件夹下有多个文件夹,输入A文件夹路径即可,如果跨文件夹对比则勾选选项即可,不跨文件夹则不勾选

878-批量图片去重工具-每个文件夹单独处理-支持子孙文件夹下操作-V3.0

Q: 程序会修改原始图片吗?

A: 不会。程序只会删除或移动重复图片,不会对原始图片内容进行任何修改。

Q: 如何判断应该使用什么阈值?

A: 建议从默认值开始,根据实际效果调整(下方值仅做参考):

  • 严格去重:哈希5、SSIM 0.98
  • 标准去重:哈希10、SSIM 0.95(默认)
  • 宽松去重:哈希15、SSIM 0.92

Q: 程序支持批量处理吗?

A: 程序会自动处理选定文件夹及其子文件夹中的所有图片,无需手动选择单个文件。

Q: 处理大量图片时内存不足怎么办?

A: 可以尝试以下方法:

  1. 关闭其他占用内存的程序
  2. 分批处理大型文件夹
  3. 降低图片处理质量(通过调整参数)

程序使用环境及相关说明

1、适用的系统环境说明: win7及以上64位win操作系统 ,  注意事项:win32位系统以及mac系统需要额外定制开发

2、关于使用限制①无需注册、登录等限制,直接使用,  ②没有电脑台数限制,  ③无使用时间限制、不联网本地使用、确保数据安全

3、程序如何安装:不需要安装,按照说明使用即可。

特别注意:请先测试,注意备份原文件,之后再批量使用,避免不可逆损失。

程序使用说明

解压后,看到如下文件,双击快捷方式使用即可(快捷方式上有个箭头),快捷方式可以放到任意位置。
如下所示,文件夹及文件夹内所有内容都不要删除,如果突然无法使用了大概率是杀毒软件给误杀了,请重新解压使用即可
878-批量图片去重工具-每个文件夹单独处理-支持子孙文件夹下操作-V3.0

本工具下载地址

软件下载链接 & 教程内容 已隐藏,开通网站会员可免费查看
售价:300 元
体验会员免费查看
开通会员
开通体验会员或更高级的会员可免费查看该内容

登录注册购买      开通会员免费查看

 


更新日志

V3.0

  • 随机文章
  • 热门文章

收藏本文章

返回列表
上一篇:
下一篇:
您需要 登录账户 后才能发表评论

发表评论取消回复中国互联网举报中心

快捷回复:

验证码

    评论列表 (暂无评论,共18人参与)参与讨论

    还没有评论,来说两句吧...