0

0

iText 7 PDF 中正确显示德语特殊字符(äöüß)的完整解决方案

聖光之護

聖光之護

发布时间:2026-03-02 12:39:10

|

649人浏览过

|

来源于php中文网

原创

iText 7 PDF 中正确显示德语特殊字符(äöüß)的完整解决方案

本文详解在 itext 7 中通过字体嵌入与编码匹配解决德语等 unicode 字符(如 ä、ö、ü、ß)无法正常显示的问题,涵盖字体选择、编码设置、源码保存格式及常见误区,确保硬编码字符串与用户输入均能正确渲染。

本文详解在 itext 7 中通过字体嵌入与编码匹配解决德语等 unicode 字符(如 ä、ö、ü、ß)无法正常显示的问题,涵盖字体选择、编码设置、源码保存格式及常见误区,确保硬编码字符串与用户输入均能正确渲染。

在使用 iText 7(kernel、layout、pdfa 等模块)生成 PDF 时,若文档中包含德语变音符号(如 ä、ö、ü、ß)或其它非 ASCII 字符,常出现空白、方块、问号或乱码——即使代码中明确指定 "UTF-8" 编码,问题仍持续存在。根本原因并非 iText 不支持 Unicode,而是字体编码模式、Java 源文件编码、PDF 字体嵌入策略三者未协同一致

✅ 正确做法:使用 IDENTITY_H + 真实 Unicode 字体(推荐)

iText 7 中,处理多语言文本(尤其是含组合字符、扩展拉丁字母的文本)的唯一可靠方式是使用 IDENTITY_H 编码并嵌入支持 Unicode 的 TrueType 字体(如 Noto Sans、DejaVu Sans、FreeSans)。IDENTITY_H 启用 CID 字体机制,允许每个 Unicode 码点映射到字形,完全绕过传统单字节编码(如 UTF-8、CP1252、ISO-8859-1)的局限。

以下为可直接运行的完整示例:

志设AI
志设AI

志设AI是一站式AI设计平台,集“AI生图 + 在线设计 + 素材交易 + 收益分成”于一体。

下载
import com.itextpdf.kernel.font.PdfFont;
import com.itextpdf.kernel.font.PdfFontFactory;
import com.itextpdf.kernel.font.PdfFontFactory;
import com.itextpdf.kernel.pdf.PdfDocument;
import com.itextpdf.kernel.pdf.PdfWriter;
import com.itextpdf.layout.Document;
import com.itextpdf.layout.element.Paragraph;

import java.io.IOException;

public class UnicodePdfExample {
    public static void main(String[] args) throws IOException {
        String outputPath = "german-unicode.pdf";
        String fontPath = "font/FreeSans.ttf"; // 确保该路径下存在支持 Unicode 的 TTF 文件

        PdfWriter writer = new PdfWriter(outputPath);
        PdfDocument pdf = new PdfDocument(writer);
        Document document = new Document(pdf);

        // ✅ 关键:使用 IDENTITY_H 编码 + 嵌入字体(自动启用 CID)
        PdfFont unicodeFont = PdfFontFactory.createFont(fontPath, "Identity-H", true);

        // 硬编码字符串(源文件必须保存为 UTF-8!)
        String text = "Hallo Welt! Grüße von München: äöü߀—…";
        Paragraph p = new Paragraph(text).setFont(unicodeFont);

        document.add(p);
        document.close();

        System.out.println("PDF generated with correct Unicode rendering.");
    }
}

? 关键参数说明

  • "Identity-H":固定字符串,不可写作 "UTF-8" 或 "utf8";这是 iText 7 中启用 Unicode 支持的专用标识;
  • true:表示强制嵌入字体子集(推荐),确保 PDF 在任意设备上均可正确显示;
  • 字体文件(如 FreeSans.ttf)必须真实包含 U+00E4(ä)、U+00F6(ö)等码位的字形(可使用 FontDrop 验证)。

⚠️ 常见错误与规避指南

错误做法 问题原因 正确替代
PdfFontFactory.createFont(fontPath, "UTF-8") "UTF-8" 是非法编码名,iText 7 会静默降级为 WinAnsiEncoding,导致 Unicode 丢失 ✅ 改用 "Identity-H"
使用 StandardFonts.HELVETICA + PdfEncodings.UTF8 Helvetica Base 14 字体不包含 äöüß 等字符,编码设置无效 ✅ 必须使用外部 TTF 并嵌入
源码文件保存为 GBK / ISO-8859-1 Java 编译器按文件编码解析字符串字面量,若 .java 是 ISO-8859-1 但写入 ä,实际读为 0xE4(非 Unicode 码点) IDE 中统一设为 UTF-8(IntelliJ/Android Studio → File → Settings → Editor → File Encodings)
仅调用 document.setFont(font) 全局设置 Paragraph 构造时若未显式绑定字体,可能回退到默认无 Unicode 支持的字体 每个文本元素显式 .setFont()(如示例中 new Paragraph(...).setFont(...))

? 补充建议

  • 字体选择优先级:Noto Sans > DejaVu Sans > FreeSans > Arial Unicode MS(避免使用 Windows 默认字体,跨平台兼容性差);
  • 调试技巧:生成 PDF 后,用 Adobe Acrobat → 文件 → 属性 → 字体,确认字体是否“已嵌入”且编码为 CID-0;
  • Web 应用注意:若文本来自 HTTP 请求,确保 request.setCharacterEncoding("UTF-8") 且响应头含 Content-Type: text/html; charset=UTF-8;
  • iText 5 用户注意:本文方案仅适用于 iText 7.x;iText 5 需使用 BaseFont.IDENTITY_H + ColumnText 等不同 API。

遵循以上方案,无论是硬编码字符串 "Grüße",还是从表单、数据库、API 获取的 UTF-8 字符串,均可在 PDF 中精准呈现,彻底告别乱码困扰。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

658

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

219

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1560

2023.10.24

字符串介绍
字符串介绍

字符串是一种数据类型,它可以是任何文本,包括字母、数字、符号等。字符串可以由不同的字符组成,例如空格、标点符号、数字等。在编程中,字符串通常用引号括起来,如单引号、双引号或反引号。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

645

2023.11.24

java读取文件转成字符串的方法
java读取文件转成字符串的方法

Java8引入了新的文件I/O API,使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java,可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中,你需要将文件路径替换为你的实际文件路径,并且可能需要处理可能的IOException异常。想了解更多java的相关内容,可以阅读本专题下面的文章。

1108

2024.03.22

php中定义字符串的方式
php中定义字符串的方式

php中定义字符串的方式:单引号;双引号;heredoc语法等等。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

1062

2024.04.29

go语言字符串相关教程
go语言字符串相关教程

本专题整合了go语言字符串相关教程,阅读专题下面的文章了解更多详细内容。

187

2025.07.29

c++字符串相关教程
c++字符串相关教程

本专题整合了c++字符串相关教程,阅读专题下面的文章了解更多详细内容。

90

2025.08.07

Golang 测试体系与代码质量保障:工程级可靠性建设
Golang 测试体系与代码质量保障:工程级可靠性建设

Go语言测试体系与代码质量保障聚焦于构建工程级可靠性系统。本专题深入解析Go的测试工具链(如go test)、单元测试、集成测试及端到端测试实践,结合代码覆盖率分析、静态代码扫描(如go vet)和动态分析工具,建立全链路质量监控机制。通过自动化测试框架、持续集成(CI)流水线配置及代码审查规范,实现测试用例管理、缺陷追踪与质量门禁控制,确保代码健壮性与可维护性,为高可靠性工程系统提供质量保障。

48

2026.02.28

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
成为PHP架构师-自制PHP框架
成为PHP架构师-自制PHP框架

共28课时 | 2.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号