904-批量文件查重

图片查重/去重工具是一款专业的图片管理软件,快速识别和处理重复或相似的图片文件。该工具基于感知哈希算法实现图片相似度检测,支持精确重复检测相似图片查找两种模式

该软件的核心功能包括:通过计算图片的平均哈希值来识别完全相同的图片文件;通过比较哈希差值来发现视觉上相似的图片;支持递归扫描子目录;提供安全的删除确认机制;实时显示处理进度和操作日志。

904-批量文件查重

功能特点

精确重复检测:通过计算图片的平均哈希值,快速识别完全相同的图片文件。无论文件名如何变化,只要图片内容相同,都能被准确识别出来。

相似图片查找:采用感知哈希算法比较图片的视觉特征,可检测出经过压缩、裁剪、调色等处理后的相似图片。用户可自定义相似度阈值(1-20),阈值越小匹配越严格。

双界面支持:

同时提供图形用户界面(GUI)和命令行界面(CLI)。图形界面直观易用,适合普通用户;

命令行界面灵活高效,适合批量处理和自动化脚本。

递归搜索:支持递归扫描子目录,一键查找整个文件夹树中的重复图片,无需手动逐个目录检查。

安全删除机制:删除操作前会显示详细的文件列表供用户确认,图形界面中标记保留和删除的文件,命令行界面需要用户输入确认,防止误删重要文件。

实时进度反馈:处理过程中实时显示进度条和当前处理的文件名,让用户了解任务执行状态。

多格式支持:支持常见的图片格式,包括JPG、JPEG、PNG、BMP、GIF、TIFF、WEBP等。

详细使用说明

图形界面使用说明

图形界面采用标签页设计,主要包含图片查重标签页和关于标签页。

目录选择区域:通过输入框直接输入目录路径,或点击”浏览…”按钮打开文件夹选择对话框。

选项配置区域

  • 查找模式:选择”精确重复”检测完全相同的图片,或”相似图片”检测视觉相似的图片
  • 相似度阈值:拖动滑块设置相似度判定标准(仅在相似图片模式下生效),数值越小要求越严格
  • 递归搜索子目录:勾选后将扫描所选目录下的所有子文件夹

控制按钮

  • 开始查找:启动扫描任务,扫描期间按钮会变为禁用状态
  • 删除选中:删除标记为”[删除]”或”[相似]”的文件,扫描完成后自动启用
  • 清除结果:清空当前结果列表,重置界面状态

结果列表区域:以表格形式展示扫描结果,包含状态、文件路径、文件大小、所属分组四列。绿色标记的”[保留]”或”[原始]”文件将被保留,红色标记的”[删除]”或”[相似]”文件为待删除项。

日志区域:底部滚动文本框实时显示操作日志,包括扫描进度、处理结果、错误信息等。

命令行界面使用说明

命令行界面提供完整的参数控制,适合批量处理和脚本集成。

基本参数

参数简写说明
—path-p图片目录路径(必填)
—recursive-r递归搜索子目录
—delete-d删除重复文件
—no-confirm-N删除时不确认(需与-d一起使用)
—similar-s查找相似图片模式
—threshold-t相似度阈值(1-20,默认5)
—verbose-v显示详细输出

使用示例

仅显示重复图片(不删除):

  1. python源代码.py -p D:\Photos

递归查找所有子目录:

  1. python源代码.py -r -p D:\Photos

查找并删除重复文件(需确认):

  1. python源代码.py -r -d -p D:\Photos

直接删除不确认(谨慎使用):

  1. python源代码.py -r -d -N -p D:\Photos

查找相似图片(阈值10):

  1. python源代码.py -r -s -t 10 -p D:\Photos

使用场景示例

场景一:整理手机备份照片

用户从手机导出了多年的照片备份,文件夹结构复杂,存在大量重复照片。使用本工具可以快速清理:

  1. 运行图形界面,选择照片备份根目录
  2. 勾选”递归搜索子目录”
  3. 选择”精确重复”模式
  4. 点击”开始查找”,等待扫描完成
  5. 检查结果列表,确认无误后点击”删除选中”
  6. 工具会自动保留每组重复文件中的一个,删除其余副本

场景二:筛选相似素材图片

设计师需要从大量素材中筛选出相似的图片进行整理。这些图片可能经过压缩、裁剪或调色处理:

  1. 运行图形界面,选择素材文件夹
  2. 勾选”递归搜索子目录”
  3. 选择”相似图片”模式
  4. 根据需要调整相似度阈值(建议从5开始尝试)
  5. 点击”开始查找”进行扫描
  6. 查看结果,根据实际相似度调整阈值重新扫描
  7. 确认后删除不需要的版本

场景三:服务器批量清理重复图片

网站服务器积累了大量用户上传的图片,需要定期清理重复文件以节省存储空间。使用命令行界面可以方便地集成到定时任务中:

  1. # 查看重复图片列表
  2. python源代码.py -r -v -p /var/www/uploads/images
  3.  
  4. # 确认后执行删除(需要确认)
  5. python源代码.py -r -d -p /var/www/uploads/images
  6.  
  7. # 或集成到脚本中自动执行(不确认)
  8. python源代码.py -r -d -N -p /var/www/uploads/images

注意事项

数据备份:在执行删除操作前,强烈建议对重要图片进行备份。虽然工具提供了确认机制,但数据安全始终是首要考虑。

删除不可恢复:文件删除操作是永久性的,无法通过回收站恢复。请务必仔细核对删除列表后再确认操作。

相似度阈值调整:相似图片模式下,阈值设置对结果影响较大。建议先用较小的阈值测试,再根据实际需求调整。

大文件处理:处理大量图片时可能需要较长时间,请耐心等待。图形界面会显示实时进度,命令行可使用-v参数查看详细信息。

文件权限:确保程序对目标目录有读取权限,对需要删除的文件有写入权限。

常见问题解答

Q: 为什么有些明显相同的图片没有被识别为重复?

A: 如果图片经过了重新编码、压缩或格式转换,其哈希值可能会发生变化。建议使用”相似图片”模式,并适当调高阈值。

Q: 删除文件时提示”删除失败”怎么办?

A: 可能原因包括:文件被其他程序占用、文件权限不足、文件路径包含特殊字符等。请关闭可能占用文件的程序,或以管理员权限运行工具。

Q: 相似度阈值应该设置为多少?

A: 默认值5适用于大多数场景。阈值越小匹配越严格(只检测非常相似的图片),阈值越大匹配越宽松(可能检测出不太相似的图片)。建议从默认值开始,根据实际结果调整。

Q: 支持哪些图片格式?

A: 支持JPG、JPEG、PNG、BMP、GIF、TIFF、WEBP等常见格式。对于不支持的格式,程序会跳过并记录日志。

Q: 删除时会保留哪个文件?

A: 每组重复文件中,程序会保留文件名排序后的第一个文件,其余文件标记为待删除。可以在图形界面中查看具体标记。

程序使用环境及相关说明

1、适用的系统环境说明: win7及以上64位win操作系统 ,  注意事项:win32位系统以及mac系统需要额外定制开发

2、关于使用限制①无需注册、登录等限制,直接使用,  ②没有电脑台数限制,  ③无使用时间限制、不联网本地使用、确保数据安全

3、程序如何安装:不需要安装,按照说明使用即可。

特别注意:请先测试,注意备份原文件,之后再批量使用,避免不可逆损失。

程序使用说明

解压后,看到如下文件,双击快捷方式使用即可(快捷方式上有个箭头),快捷方式可以放到任意位置。
904-批量文件查重
如下所示,文件夹及文件夹内所有内容都不要删除,如果突然无法使用了大概率是杀毒软件给误杀了,请重新解压使用即可
904-批量文件查重

本工具下载地址

软件下载链接 & 教程内容 已隐藏,开通网站会员可免费查看
售价:80 元
体验会员免费查看
开通会员
开通体验会员或更高级的会员可免费查看该内容

登录注册购买      开通会员免费查看

 


更新日志

V1.0

  • 随机文章
  • 热门文章

收藏本文章

返回列表
上一篇:
下一篇:
您需要 登录账户 后才能发表评论

发表评论取消回复中国互联网举报中心

快捷回复:

验证码

    评论列表 (暂无评论,共2人参与)参与讨论

    还没有评论,来说两句吧...