0

0

PDF如何实现PDF批量重命名_PDF文档属性提取与更名教程

P粉602998670

P粉602998670

发布时间:2026-01-02 09:22:02

|

399人浏览过

|

来源于php中文网

原创

可通过四种方法批量重命名pdf:一、python脚本(pikepdf)提取元数据;二、adobe acrobat pro动作向导;三、pdftk+shell脚本(macos/linux);四、powershell脚本(windows)。

pdf如何实现pdf批量重命名_pdf文档属性提取与更名教程

如果您拥有一批PDF文件,但它们的文件名缺乏统一规范或无法反映文档内容,可以通过提取PDF元数据(如标题、作者、创建日期等)来批量重命名。以下是实现PDF批量重命名的具体操作方法:

一、使用Python脚本提取PDF属性并重命名

该方法基于PyPDF2或pikepdf库读取PDF文档的内置元数据(Document Information Dictionary),提取Title、Author、CreationDate等字段,并按预设模板生成新文件名。适用于Windows、macOS和Linux系统,需提前安装Python环境。

1、打开终端或命令提示符,执行pip install pikepdf安装依赖库。

2、新建一个文本文件,将后缀改为.py,例如rename_pdfs.py

3、在文件中写入以下代码:
import os
import pikepdf
from datetime import datetime

pdf_dir = "请替换为您的PDF所在文件夹绝对路径"
for filename in os.listdir(pdf_dir):
  if filename.lower().endswith(".pdf"):
    filepath = os.path.join(pdf_dir, filename)
    try:
      pdf = pikepdf.Pdf.open(filepath)
      meta = pdf.docinfo
      title = str(meta.Title).strip() if meta.Title else "Untitled"
      author = str(meta.Author).strip() if meta.Author else "Unknown"
      date_str = ""
      if meta.CreationDate:
        try:
          date_obj = datetime.strptime(str(meta.CreationDate), "D:%Y%m%d%H%M%S%z")
          date_str = date_obj.strftime("_%Y%m%d")
        except:
          date_str = "_unknown"
      new_name = f"{title[:50].replace('/', '-').replace(':', '-')}_{author[:20].replace('/', '-')} {date_str}.pdf"
      new_path = os.path.join(pdf_dir, new_name)
      os.rename(filepath, new_path)
    except Exception as e:
      print(f"跳过 {filename}:{e}")

4、修改代码中pdf_dir变量值为实际PDF文件夹路径,确保路径中不含中文或特殊符号(建议使用英文路径)。

5、在终端中进入该.py文件所在目录,运行python rename_pdfs.py

二、使用Adobe Acrobat Pro批量重命名

Adobe Acrobat Pro内置“动作向导”功能支持基于PDF属性(如文档标题、作者、主题)构建命名规则,并对多个PDF文件一次性执行重命名。此方法无需编程基础,但需已安装Acrobat Pro DC版本。

1、启动Adobe Acrobat Pro DC,点击右上角工具 > 动作向导 > 创建新动作

2、在“开始”部分选择选取文件,点击添加按钮,在弹出窗口中勾选包含子文件夹中的文件

3、在“完成”部分点击添加操作,搜索并双击重命名文件

4、在“重命名文件”设置中,点击添加项目,依次插入:文档标题下划线作者下划线创建日期(格式选YYYYMMDD)

5、点击保存,为动作命名为“按属性重命名”,然后点击完成

WPS灵犀
WPS灵犀

WPS灵犀是WPS推出的一款AI智能办公和学习助手

下载

6、在动作列表中选中刚创建的动作,点击开始,选择目标PDF文件夹,确认执行。

三、使用PDFtk与Shell脚本(macOS/Linux)

PDFtk是一款命令行PDF处理工具,配合shell脚本可从PDF中提取Info字段并调用mv命令重命名。适用于熟悉终端操作的用户,不依赖图形界面。

1、在macOS上通过Homebrew安装PDFtk:brew install pdftk-java;在Ubuntu上执行sudo apt install pdftk

2、进入PDF所在目录,运行ls *.pdf | head -n 5确认文件列表正常显示。

3、执行以下命令生成重命名脚本:
for f in *.pdf; do info=$(pdftk "$f" dump_data | grep -E "InfoKey: (Title|Author)|InfoValue:" | sed 's/InfoKey: //; s/InfoValue: //'); title=$(echo "$info" | grep "Title" -A1 | tail -n1 | sed 's/^ *//'); author=$(echo "$info" | grep "Author" -A1 | tail -n1 | sed 's/^ *//'); datestr=$(date -r "$f" +%Y%m%d 2>/dev/null || stat -f "%Sm" -t "%Y%m%d" "$f" 2>/dev/null); newname="${title:-Unknown}_${author:-Unknown}_${datestr:-unknown}.pdf"; echo mv "$f" "$newname"; done > rename.sh

4、检查生成的rename.sh内容是否符合预期,删除所有echo前缀以启用真实重命名:sed -i '' 's/^echo mv/mv/' rename.sh(macOS)或sed -i 's/^echo mv/mv/' rename.sh(Linux)。

5、赋予执行权限并运行:chmod +x rename.sh && ./rename.sh

四、使用PowerShell脚本(Windows原生方案)

Windows系统可利用PowerShell结合开源库iTextSharp或直接解析PDF二进制结构中的Info字典区段,提取关键属性。本方案使用PowerShell原生命令配合正则匹配PDF原始信息流,无需额外安装软件。

1、以管理员身份打开PowerShell,执行Set-ExecutionPolicy RemoteSigned -Scope CurrentUser允许本地脚本运行。

2、新建文本文件,扩展名为.ps1,例如pdf_rename.ps1

3、在文件中粘贴以下内容:
$folder = "请替换为您的PDF文件夹路径"
Get-ChildItem $folder -Filter "*.pdf" | ForEach-Object {
  $content = [System.IO.File]::ReadAllText($_.FullName)
  $title = if ($content -match "/Titles+(([^)]+))") { $matches[1] } else { "Untitled" }
  $author = if ($content -match "/Authors+(([^)]+))") { $matches[1] } else { "Unknown" }
  $date = Get-Date $_.CreationTime -Format "yyyyMMdd"
  $safe_title = $title -replace '[\/*?:"|]', '-'
  $safe_author = $author -replace '[\/*?:"|]', '-'
  $newName = "$safe_title`_$safe_author`_$date.pdf"
  $newPath = Join-Path $folder $newName
  Rename-Item $_.FullName $newPath -ErrorAction SilentlyContinue
}

4、修改脚本中$folder变量为实际路径,注意路径使用反斜杠且需加引号。

5、在PowerShell中执行.pdf_rename.ps1(首次运行需确认策略提示)。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
pip安装使用方法
pip安装使用方法

安装步骤:1、确保Python已经正确安装在您的计算机上;2、下载“get-pip.py”脚本;3、按下Win + R键,然后输入cmd并按下Enter键来打开命令行窗口;4、在命令行窗口中,使用cd命令切换到“get-pip.py”所在的目录;5、执行安装命令;6、验证安装结果即可。大家可以访问本专题下的文章,了解pip安装使用方法的更多内容。

373

2023.10.09

更新pip版本
更新pip版本

更新pip版本方法有使用pip自身更新、使用操作系统自带的包管理工具、使用python包管理工具、手动安装最新版本。想了解更多相关的内容,请阅读专题下面的文章。

431

2024.12.20

pip设置清华源
pip设置清华源

设置方法:1、打开终端或命令提示符窗口;2、运行“touch ~/.pip/pip.conf”命令创建一个名为pip的配置文件;3、打开pip.conf文件,然后添加“[global];index-url = https://pypi.tuna.tsinghua.edu.cn/simple”内容,这将把pip的镜像源设置为清华大学的镜像源;4、保存并关闭文件即可。

793

2024.12.23

python升级pip
python升级pip

本专题整合了python升级pip相关教程,阅读下面的文章了解更多详细内容。

369

2025.07.23

python中print函数的用法
python中print函数的用法

python中print函数的语法是“print(value1, value2, ..., sep=' ', end=' ', file=sys.stdout, flush=False)”。本专题为大家提供print相关的文章、下载、课程内容,供大家免费下载体验。

192

2023.09.27

python print用法与作用
python print用法与作用

本专题整合了python print的用法、作用、函数功能相关内容,阅读专题下面的文章了解更多详细教程。

17

2026.02.03

c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

252

2023.09.22

java中null的用法
java中null的用法

在Java中,null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量,包括类、接口、数组、字符串等。想了解更多null的相关内容,可以阅读本专题下面的文章。

988

2024.03.01

PHP高性能API设计与Laravel服务架构实践
PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开,重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景,深入分析性能瓶颈定位与优化思路,帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

4

2026.03.04

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 10.1万人学习

Git 教程
Git 教程

共21课时 | 4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号