0

0

php读取rtf文件如何读取字体_php读取rtf字体信息法【技巧】

絕刀狂花

絕刀狂花

发布时间:2026-01-25 17:55:38

|

965人浏览过

|

来源于php中文网

原创

PHP不原生支持RTF字体解析,需手动提取 onttbl中 N定义及分号前的字体名,注意编码转换与Unicode转义,或使用rtf-html-php等现成解析器。

php读取rtf文件如何读取字体_php读取rtf字体信息法【技巧】

PHP 本身不原生支持 RTF 文件解析,更不会直接提取字体信息;要读取 RTF 中的字体(如 0 swiss Helvetica 1 roman Times New Roman),需手动解析 RTF 控制字。核心思路是:**跳过控制符和组结构,提取 N 定义及后续的字体名称声明( N name N roman 等)**。

理解 RTF 字体定义的基本结构

RTF 中字体通过 onttbl 控制字定义,格式类似:

{onttbl{0swisscharset0 Helvetica;}{1romancharset0 Times New Roman;}}

关键点:

  • 0 1 是字体 ID,用于正文中标记(如 0 s24 Hello
  • swiss roman 是字体族标识(非名称),实际名称在分号前,如 HelveticaTimes New Roman
  • 字体名可能含空格、括号或 Unicode 转义(如 'e9 表示 é),需按 RTF 规则解码

用正则 + 状态机粗略提取字体表

适用于格式规范、无嵌套错误的 RTF(如 Word 生成的基础文档)。不依赖外部库,轻量可行:

AIBox 一站式AI创作平台
AIBox 一站式AI创作平台

AIBox365一站式AI创作平台,支持ChatGPT、GPT4、Claue3、Gemini、Midjourney等国内外大模型

下载

立即学习PHP免费学习笔记(深入)”;

  • 先用 file_get_contents() 读取文件,确保编码为 ANSI 或 UTF-8(RTF 头部 nsicpg936 等提示代码页)
  • 用正则定位 onttbl{...} 区域(注意大括号嵌套,建议用简单匹配+模拟,或用 preg_match('/\\fonttbl{([^}]*)}/i', $rtf, $matches) 初筛)
  • 对匹配内容逐字符解析:识别 d+ 后紧跟的 [swiss|roman|modern|...] 或直接字体名(直到分号或空格)
  • 示例片段提取逻辑:
$pattern = '/\\f(d+)\\f[^;]+?\\fcharsetd+s+([^;]+);/i';
preg_match_all($pattern, $fonttbl_content, $fonts);
$fontMap = array_combine($fonts[1], array_map('trim', $fonts[2])); // ['0'=>'Helvetica', '1'=>'Times New Roman']

处理中文与编码问题

中文 RTF 常用 nsicpg936(GBK)或 uc1 + Unicode 转义('e4')。PHP 读取后需:

  • 检查 RTF 头部 nsicpg 值,用 mb_convert_encoding($text, 'UTF-8', 'GBK') 转换(若为 936)
  • 替换 Unicode 转义:preg_replace_callback("/'([0-9a-fA-F]{2})/", function($m) { return mb_chr(hexdec($m[1]), 'UTF-8'); }, $str)
  • 字体名中若含 '(撇号)或 ,需在正则中转义或预清理

更稳方案:用现成解析器(推荐)

手工解析易出错,尤其面对复杂格式。可考虑:

  • rtf-html-php(GitHub 开源):将 RTF 转 HTML,再用 DOM 解析 <font face="..."> 或内联样式
  • PHPWord:支持读取部分 RTF(需开启扩展),通过 PhpWordReaderRTF 获取段落样式,间接推断字体
  • 调用系统命令(Linux/macOS):unrtf --textcatdoc 提取纯文本,但会丢失字体信息——仅适合不需要字体的场景

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

447

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

606

2023.08.10

function是什么
function是什么

function是函数的意思,是一段具有特定功能的可重复使用的代码块,是程序的基本组成单元之一,可以接受输入参数,执行特定的操作,并返回结果。本专题为大家提供function是什么的相关的文章、下载、课程内容,供大家免费下载体验。

499

2023.08.04

js函数function用法
js函数function用法

js函数function用法有:1、声明函数;2、调用函数;3、函数参数;4、函数返回值;5、匿名函数;6、函数作为参数;7、函数作用域;8、递归函数。本专题提供js函数function用法的相关文章内容,大家可以免费阅读。

166

2023.10.07

DOM是什么意思
DOM是什么意思

dom的英文全称是documentobjectmodel,表示文件对象模型,是w3c组织推荐的处理可扩展置标语言的标准编程接口;dom是html文档的内存中对象表示,它提供了使用javascript与网页交互的方式。想了解更多的相关内容,可以阅读本专题下面的文章。

4348

2024.08.14

github中文官网入口 github中文版官网网页进入
github中文官网入口 github中文版官网网页进入

github中文官网入口https://docs.github.com/zh/get-started,GitHub 是一种基于云的平台,可在其中存储、共享并与他人一起编写代码。 通过将代码存储在GitHub 上的“存储库”中,你可以: “展示或共享”你的工作。 持续“跟踪和管理”对代码的更改。

4296

2026.01.21

macOS怎么切换用户账户
macOS怎么切换用户账户

在 macOS 系统中,可通过多种方式切换用户账户。如点击苹果图标选择 “系统偏好设置”,打开 “用户与群组” 进行切换;或启用快速用户切换功能,通过菜单栏或控制中心的账户名称切换;还能使用快捷键 “Control+Command+Q” 锁定屏幕后切换。

359

2025.05.09

磁盘配额是什么
磁盘配额是什么

磁盘配额是计算机中指定磁盘的储存限制,就是管理员可以为用户所能使用的磁盘空间进行配额限制,每一用户只能使用最大配额范围内的磁盘空间。php中文网为大家提供各种磁盘配额相关的内容,教程,供大家免费下载安装。

1564

2023.06.21

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

26

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PHP课程
PHP课程

共137课时 | 13.5万人学习

JavaScript ES5基础线上课程教学
JavaScript ES5基础线上课程教学

共6课时 | 11.3万人学习

PHP新手语法线上课程教学
PHP新手语法线上课程教学

共13课时 | 1.0万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号