0

0

将Markdown内容转换为XML格式

星降

星降

发布时间:2026-01-20 10:07:02

|

156人浏览过

|

来源于php中文网

原创

Markdown转XML无统一标准,必须先明确目标XML结构和用途;不能直接用markdown-it或marked,因其不保证XML良构性;推荐用remark-parse解析为AST后,以xmlbuilder2按需构建XML。

将markdown内容转换为xml格式

Markdown 转 XML 没有统一标准,必须先明确目标 XML 的结构和用途——是用于文档归档(如 DocBook)、网页渲染(如 XHTML),还是自定义数据交换格式?直接套用通用转换器大概率会失败。

为什么不能用 markdown-itmarked 直接生成 XML?

这些库默认输出 HTML 字符串,即使开启 html: false 也只是禁用内联 HTML 标签,仍会保留非 XML 兼容的转义(如  )或缺失 XML 声明与根元素。更关键的是:它们不校验标签闭合、不处理命名空间、也不保证属性值被双引号包裹——而这些都是良构 XML 的硬性要求。

xmlbuilder2 + 手动解析 Markdown AST 最可靠

推荐流程:用 remark-parse 解析 Markdown 为统一 AST(unist 树),再遍历节点,用 xmlbuilder2 构建符合你 Schema 的 XML。这样能完全控制每个节点的映射逻辑,比如:

  • heading 节点 →

    ,取决于你的 DTD
  • list 节点 → 强制用
      /
        ,而非自定义
      1. inlineCode → 包裹在 中,而非裸文本

      示例片段(将一级标题转为 ):

      短影AI
      短影AI

      长视频一键生成精彩短视频

      下载
      const { remark } = await import('remark');
      const { xml } = await import('xmlbuilder2');
      

      const md = '# Hello World'; const tree = (await remark().use(() => {}).parse(md));

      const doc = xml({ version: '1.0', encoding: 'UTF-8' }); const root = doc.ele('document');

      function walk(node) { if (node.type === 'heading' && node.depth === 1) { const title = node.children[0]?.value || ''; root.ele('doc-title').txt(title); } } walk(tree);

      console.log(doc.end({ prettyPrint: true })); // 输出: // // // Hello World //

      警惕 pandoc 的隐式行为

      pandoc -f markdown -t docbook 看似便捷,但它依赖内置模板,且:

      • 会自动插入
        等语义化标签,无法关闭
      • 对中文标点、脚注、自定义容器(如 :::warning)支持不稳定
      • 输出含 xmlnsrole 属性,若下游系统不认这些命名空间,解析会报错

      如果只是临时导出,加 --wrap=none --standalone 可减少干扰;但生产环境建议绕过 pandoc,走 AST 路线。

      真正难的不是语法转换,而是决定每个 Markdown 语义单元对应哪个 XML 元素——这个映射规则一旦定错,后续所有 XSLT 或 XPath 都得重写。

      相关专题

      更多
      html版权符号
      html版权符号

      html版权符号是“©”,可以在html源文件中直接输入或者从word中复制粘贴过来,php中文网还为大家带来html的相关下载资源、相关课程以及相关文章等内容,供大家免费下载使用。

      616

      2023.06.14

      html在线编辑器
      html在线编辑器

      html在线编辑器是用于在线编辑的工具,编辑的内容是基于HTML的文档。它经常被应用于留言板留言、论坛发贴、Blog编写日志或等需要用户输入普通HTML的地方,是Web应用的常用模块之一。php中文网为大家带来了html在线编辑器的相关教程、以及相关文章等内容,供大家免费下载使用。

      655

      2023.06.21

      html网页制作
      html网页制作

      html网页制作是指使用超文本标记语言来设计和创建网页的过程,html是一种标记语言,它使用标记来描述文档结构和语义,并定义了网页中的各种元素和内容的呈现方式。本专题为大家提供html网页制作的相关的文章、下载、课程内容,供大家免费下载体验。

      470

      2023.07.31

      html空格
      html空格

      html空格是一种用于在网页中添加间隔和对齐文本的特殊字符,被用于在网页中插入额外的空间,以改变元素之间的排列和对齐方式。本专题为大家提供html空格的相关的文章、下载、课程内容,供大家免费下载体验。

      245

      2023.08.01

      html是什么
      html是什么

      HTML是一种标准标记语言,用于创建和呈现网页的结构和内容,是互联网发展的基石,为网页开发提供了丰富的功能和灵活性。本专题为大家提供html相关的各种文章、以及下载和课程。

      2895

      2023.08.11

      html字体大小怎么设置
      html字体大小怎么设置

      在网页设计中,字体大小的选择是至关重要的。合理的字体大小不仅可以提升网页的可读性,还能够影响用户对网页整体布局的感知。php中文网将介绍一些常用的方法和技巧,帮助您在HTML中设置合适的字体大小。

      505

      2023.08.11

      html转txt
      html转txt

      html转txt的方法有使用文本编辑器、使用在线转换工具和使用Python编程。本专题为大家提供html转txt相关的文章、下载、课程内容,供大家免费下载体验。

      312

      2023.08.31

      html文本框代码怎么写
      html文本框代码怎么写

      html文本框代码:1、单行文本框【<input type="text" style="height:..;width:..;" />】;2、多行文本框【textarea style=";height:;"></textare】。

      426

      2023.09.01

      Java JVM 原理与性能调优实战
      Java JVM 原理与性能调优实战

      本专题系统讲解 Java 虚拟机(JVM)的核心工作原理与性能调优方法,包括 JVM 内存结构、对象创建与回收流程、垃圾回收器(Serial、CMS、G1、ZGC)对比分析、常见内存泄漏与性能瓶颈排查,以及 JVM 参数调优与监控工具(jstat、jmap、jvisualvm)的实战使用。通过真实案例,帮助学习者掌握 Java 应用在生产环境中的性能分析与优化能力。

      3

      2026.01.20

      热门下载

      更多
      网站特效
      /
      网站源码
      /
      网站素材
      /
      前端模板

      精品课程

      更多
      相关推荐
      /
      热门推荐
      /
      最新课程
      Bootstrap 5教程
      Bootstrap 5教程

      共46课时 | 2.9万人学习

      AngularJS教程
      AngularJS教程

      共24课时 | 2.8万人学习

      CSS教程
      CSS教程

      共754课时 | 21.1万人学习

      关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
      php中文网:公益在线php培训,帮助PHP学习者快速成长!
      关注服务号 技术交流群
      PHP中文网订阅号
      每天精选资源文章推送

      Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号