libxml2使用需三步:装环境、初始化、遍历节点并管理内存;安装分系统推荐方式;基础流程为版本检查、加载XML、获取根节点、递归遍历;字符串和属性需手动xmlFree;注意编码、空白节点及缩进输出。

libxml2 是 C 语言中成熟、轻量且跨平台的 XML 解析库,用起来不难,但几个关键点容易踩坑。核心就三步:装好开发环境、正确初始化、按树结构遍历节点并注意内存管理。
安装与编译准备
不同系统推荐方式不同:
- Ubuntu/Debian:直接运行
sudo apt-get install libxml2-dev,头文件和库自动就位 - CentOS/RHEL:用
yum install libxml2-devel(注意是devel,不是libxml) - 源码编译(如需指定路径或静态库):解压后执行
./configure --prefix=/usr/local && make && sudo make install,再设置export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig
编译时用 pkg-config --cflags --libs libxml-2.0 获取参数,例如:gcc test.c -o test `pkg-config --cflags --libs libxml-2.0`
基础使用流程
一个典型解析流程包含四个固定动作:
- 调用
LIBXML_TEST_VERSION初始化库(可选但推荐,做版本兼容检查) - 用
xmlReadFile()或xmlParseFile()加载 XML,返回xmlDocPtr - 用
xmlDocGetRootElement()拿到根节点xmlNodePtr - 递归遍历子节点:检查
node->type(常用XML_ELEMENT_NODE和XML_TEXT_NODE)
别忘了最后调用 xmlFreeDoc(doc) 释放文档内存。
系统简介1:安全可靠: 在微软主推的.NET开发平台上,采用业界领先的ASP.NET技术和C#语言开发,不仅安全可靠,并能保证系统的高性能运行。2:简单易用:版纳武林DIY企业建站系统真正做到以人为本、以用户体验为中心,能使您快速搭建您的网站。后台管理操作简单,一目了然,没有夹杂多余的功能和广告。3:布局易改:版纳武林DIY企业建站系统采用的是博客形式的风格管理,让您真正感受到我的地盘听我的.4:
立即学习“C语言免费学习笔记(深入)”;
处理字符串和属性要小心
libxml2 内部用 xmlChar*(本质是 unsigned char*),所有从 API 拿到的字符串都需手动释放:
- 用
xmlNodeListGetString()或xmlNodeGetContent()获取文本内容后,必须xmlFree() - 读属性值建议用
xmlGetProp(node, BAD_CAST "attr_name"),返回的xmlChar*同样要xmlFree() - 类型转换可用宏
BAD_CAST,比如(xmlChar*)"hello",避免编译警告
常见避坑提醒
这些细节不注意,程序容易崩溃或乱码:
- 默认只认 UTF-8 编码;若 XML 是 GBK/GB2312,需先用 iconv 转成 UTF-8 再喂给 libxml2
- 空白文本节点(换行缩进)默认也会被当
XML_TEXT_NODE,可用xmlIsBlankNode()过滤 -
xmlDocPtr不是智能指针,xmlNodePtr更不是——所有分配的内存都要自己管 - 写 XML 时想带缩进,记得设
xmlIndentTreeOutput = 1,再用xmlSaveFormatFile(..., 1)
基本上就这些。









