- N +

404-批量搜索删除pdf中指定内容【只能搜索文本不支持图片】-【带界面-源代码】

404-批量搜索删除pdf中指定内容【只能搜索文本不支持图片】-【带界面-源代码】原标题:404-批量搜索删除pdf中指定内容【只能搜索文本不支持图片】-【带界面-源代码】

导读:

代码功能概述该代码实现了一个用于批量处理PDF文件的图形化界面(GUI)应用程序,主要功能是删除PDF文件中指定的文本内容。它支持处理指定文件夹及其所有子文件夹中的PDF文件...

代码功能概述

该代码实现了一个用于批量处理PDF文件的图形化界面(GUI)应用程序,主要功能是删除PDF文件中指定的文本内容。它支持处理指定文件夹及其所有子文件夹中的PDF文件,并将处理后的文件保存在每个子文件夹内自动创建的 processed_files 文件夹中。

用户操作步骤

  1. 准备文本文件:在程序运行目录下创建一个名为 text_list.txt 的文本文件,每行写入要删除的文本内容。
  2. 选择文件夹:点击 “选择文件夹” 按钮,选择包含PDF文件的文件夹。
  3. 开始处理:点击 “开始程序” 按钮,程序开始处理所选文件夹及其子文件夹中的所有PDF文件。
  4. 查看日志:处理过程中的信息会显示在日志框中,包括正在处理的文件路径和处理结果。如果处理过程中出现错误,错误信息会记录在 error_log.txt 文件中,并显示在日志框中。
  5. 停止处理:如果需要中途停止处理,可以点击 “结束任务” 按钮。
  6. 清空输入和日志:可以点击 “清空输入框” 按钮清空文件夹路径输入框,点击 “清空日志” 按钮清空日志框内容。

实例验证

假设我们有以下文件夹结构:

project/
│
├── text_list.txt
│
├── pdf_folder/
│ │
│ ├── subfolder1/
│ │ ├── file1.pdf
│ │ └── file2.pdf
│ │
│ ├── subfolder2/
│ │ ├── file3.pdf
│ │ └── file4.pdf
│ │
│ ├── file5.pdf
│ └── file6.pdf
│
└── error_log.txt
  1. 在 text_list.txt 中写入要删除的文本,例如:
    1. 要删除的文本1
    2. 要删除的文本2
  2. 运行程序,点击 “选择文件夹” 按钮并选择 pdf_folder
  3. 点击 “开始程序” 按钮,程序会遍历 pdf_folder 及其子文件夹 subfolder1 和 subfolder2 中的所有PDF文件。对于每个PDF文件,程序会删除 text_list.txt 中指定的文本内容,并将处理后的文件保存在对应的 processed_files 文件夹中。例如:
project/
│
├── text_list.txt
│
├── pdf_folder/
│ │
│ ├── subfolder1/
│ │ ├── file1.pdf
│ │ ├── file2.pdf
│ │ └── processed_files/
│ │ ├── file1.pdf
│ │ └── file2.pdf
│ │
│ ├── subfolder2/
│ │ ├── file3.pdf
│ │ ├── file4.pdf
│ │ └── processed_files/
│ │ ├── file3.pdf
│ │ └── file4.pdf
│ │
│ ├── file5.pdf
│ ├── file6.pdf
│ └── processed_files/
│ ├── file5.pdf
│ └── file6.pdf
│
└── error_log.txt
  1. 日志框会显示处理过程的信息,如:
    1. 开始处理文件夹: pdf_folder
    2. 正在处理文件: pdf_folder/subfolder1/file1.pdf
    3. 处理后的PDF已保存至: pdf_folder/subfolder1/processed_files/file1.pdf
    4. 正在处理文件: pdf_folder/subfolder1/file2.pdf
    5. 处理后的PDF已保存至: pdf_folder/subfolder1/processed_files/file2.pdf
    6. ...
    7. 所有PDF文件处理完毕。
  2. 如果某个文件处理出错,例如 file3.pdf 因为权限问题无法处理,日志框会显示错误信息,并且 error_log.txt 文件中会记录:
    1. 无法处理文件: pdf_folder/subfolder2/file3.pdf 错误: PermissionError: [Errno 13] Permission denied: 'pdf_folder/subfolder2/file3.pdf'

对子文件夹的支持

该程序支持穿透子文件夹,会递归处理指定文件夹及其所有层级的子文件夹中的PDF文件。无论是直接位于指定文件夹下的PDF文件,还是位于其任意深度子文件夹中的PDF文件,都会被处理。


python版本:3.86

是否带UI界面UI版本

电脑系统版本:win10 64位 专业版系统(这是测试环境,其他环境也可以32位操作系统可能需要调整代码,让AI去转换即可)

脚本使用到的库:使用pycharm编辑器,如果没有安装相关库,会自动标红提示,鼠标放到标红的地方会弹出安装库按钮

重要提示:这是源代码,需要安装python使用,也可以自行修改部分代码实现想要的功能


查看源代码

隐藏内容,开通会员可免费查看!
售价:80 
月度会员 免费查看
开通会员
开通月度会员或更高级的会员可免费查看该内容

登录注册购买      开通会员免费查看

  • 随机文章
  • 热门文章

收藏本文章

作者:softbangong
使用批处理解放双手,使用softbangong一直赢。 学无止境,精准有效方为上上策。 softbangong你的贴身助手!
返回列表
上一篇:
下一篇:
您需要 登录账户 后才能发表评论

发表评论取消回复中国互联网举报中心

快捷回复:

验证码

    评论列表 (暂无评论,共12人参与)参与讨论

    还没有评论,来说两句吧...