原标题:404-批量搜索删除pdf中指定内容【只能搜索文本不支持图片】-【带界面-源代码】
导读:
代码功能概述该代码实现了一个用于批量处理PDF文件的图形化界面(GUI)应用程序,主要功能是删除PDF文件中指定的文本内容。它支持处理指定文件夹及其所有子文件夹中的PDF文件...
代码功能概述
该代码实现了一个用于批量处理PDF文件的图形化界面(GUI)应用程序,主要功能是删除PDF文件中指定的文本内容。它支持处理指定文件夹及其所有子文件夹中的PDF文件,并将处理后的文件保存在每个子文件夹内自动创建的 processed_files
文件夹中。
用户操作步骤
- 准备文本文件:在程序运行目录下创建一个名为
text_list.txt
的文本文件,每行写入要删除的文本内容。 - 选择文件夹:点击 “选择文件夹” 按钮,选择包含PDF文件的文件夹。
- 开始处理:点击 “开始程序” 按钮,程序开始处理所选文件夹及其子文件夹中的所有PDF文件。
- 查看日志:处理过程中的信息会显示在日志框中,包括正在处理的文件路径和处理结果。如果处理过程中出现错误,错误信息会记录在
error_log.txt
文件中,并显示在日志框中。 - 停止处理:如果需要中途停止处理,可以点击 “结束任务” 按钮。
- 清空输入和日志:可以点击 “清空输入框” 按钮清空文件夹路径输入框,点击 “清空日志” 按钮清空日志框内容。
实例验证
假设我们有以下文件夹结构:
project/
│
├── text_list.txt
│
├── pdf_folder/
│ │
│ ├── subfolder1/
│ │ ├── file1.pdf
│ │ └── file2.pdf
│ │
│ ├── subfolder2/
│ │ ├── file3.pdf
│ │ └── file4.pdf
│ │
│ ├── file5.pdf
│ └── file6.pdf
│
└── error_log.txt
- 在
text_list.txt
中写入要删除的文本,例如:要删除的文本1
要删除的文本2
- 运行程序,点击 “选择文件夹” 按钮并选择
pdf_folder
。 - 点击 “开始程序” 按钮,程序会遍历
pdf_folder
及其子文件夹subfolder1
和subfolder2
中的所有PDF文件。对于每个PDF文件,程序会删除text_list.txt
中指定的文本内容,并将处理后的文件保存在对应的processed_files
文件夹中。例如:
project/
│
├── text_list.txt
│
├── pdf_folder/
│ │
│ ├── subfolder1/
│ │ ├── file1.pdf
│ │ ├── file2.pdf
│ │ └── processed_files/
│ │ ├── file1.pdf
│ │ └── file2.pdf
│ │
│ ├── subfolder2/
│ │ ├── file3.pdf
│ │ ├── file4.pdf
│ │ └── processed_files/
│ │ ├── file3.pdf
│ │ └── file4.pdf
│ │
│ ├── file5.pdf
│ ├── file6.pdf
│ └── processed_files/
│ ├── file5.pdf
│ └── file6.pdf
│
└── error_log.txt
- 日志框会显示处理过程的信息,如:
开始处理文件夹: pdf_folder
正在处理文件: pdf_folder/subfolder1/file1.pdf
处理后的PDF已保存至: pdf_folder/subfolder1/processed_files/file1.pdf
正在处理文件: pdf_folder/subfolder1/file2.pdf
处理后的PDF已保存至: pdf_folder/subfolder1/processed_files/file2.pdf
...
所有PDF文件处理完毕。
- 如果某个文件处理出错,例如
file3.pdf
因为权限问题无法处理,日志框会显示错误信息,并且error_log.txt
文件中会记录:无法处理文件: pdf_folder/subfolder2/file3.pdf 错误: PermissionError: [Errno 13] Permission denied: 'pdf_folder/subfolder2/file3.pdf'
对子文件夹的支持
该程序支持穿透子文件夹,会递归处理指定文件夹及其所有层级的子文件夹中的PDF文件。无论是直接位于指定文件夹下的PDF文件,还是位于其任意深度子文件夹中的PDF文件,都会被处理。
python版本:3.86
是否带UI界面:UI版本
电脑系统版本:win10 64位 专业版系统(这是测试环境,其他环境也可以32位操作系统可能需要调整代码,让AI去转换即可)
脚本使用到的库:使用pycharm编辑器,如果没有安装相关库,会自动标红提示,鼠标放到标红的地方会弹出安装库按钮
重要提示:这是源代码,需要安装python使用,也可以自行修改部分代码实现想要的功能
查看源代码
- 随机文章
- 热门文章
- 706-批量将指定文件夹下所有文件格式后缀改为小写-UI
- 710-批量合并指定文件夹下同名文件夹到目标文件夹合并时覆盖同名文件
- 716-批量移动指定文件夹带有关键词文件到目标文件夹-支持多个关键词
- 724-【只对目录下一级文件夹有效】对指定目录下各文件夹下文件以文件夹名命名-遇到多个同格式的文件只命名其中一个
- 750-批量删除指定文件夹下指定文件
- 761-统计指定文件夹及其子文件夹中每种文件类型的数量
- 765-批量删除指定文件夹下文件和文件夹名中指定的字符或符号
- 781-按照创建日期-最后修改日期提取文件名到excell
- 10080-1-监测指定文件夹-支持子孙文件夹-对所有压缩包创建同名文件夹移入并解压-只支持zip-rar-7z压缩包的解压
- 454-批量检测损坏pdf文件并移动到目标文件夹内
- 1开通VIP会员享全站内容免费查看
- 2🔥🔥🔥承接各种批处理工具定制 / 售后相关信息 / 任何需求请在该文章下留言
- 3752-批量复制文件及文件夹到多个文件夹
- 410081-1-批量解压自解压文件-【支持密码-子文件穿透】【不支持嵌套自解压或压缩包解压】-除自解压文件外不能有其他exe文件
- 5790-批量统计各文件夹下文件类型数量及文件夹路径输出到excell
- 6网页插入bilibili哔哩哔哩视频
- 7401-批量识别pdf中二维码并替换为指定图片或覆盖白色
- 8431-批量合并指定文件夹下各文件夹内pdf为一个pdf文件
- 9Adobe程序完全卸载教程完全卸载无残留-【包括单个程序卸载和全部程序卸载】(win系统版本)
- 10为ps脚本添加快捷键快速调用
还没有评论,来说两句吧...