REXML是Ruby内置轻量级XML库,适合简单至中等复杂度场景;支持字符串/文件解析、XPath查找、属性文本读写及XML构建输出,但需注意大小写敏感、命名空间和空白节点处理。

REXML 是 Ruby 自带的轻量级 XML 处理库,无需额外安装,开箱即用。它适合读写简单到中等复杂度的 XML,语法直观、上手快,但不适合超大文件或高性能场景(这时建议用 Nokogiri 或 Ox)。
解析 XML 字符串或文件
用 REXML::Document 加载 XML 内容,支持字符串、IO 对象或文件路径:
- 从字符串解析:
doc = REXML::Document.new(" ")- A
- 从文件解析:
doc = REXML::Document.new(File.open("data.xml"))或更安全地用File.read:doc = REXML::Document.new(File.read("data.xml"))
遍历和查找元素
常用方法有 root、elements、each 和 XPath 风格的 get_elements:
-
doc.root获取根节点(REXML::Element实例) -
doc.root.elements['item']获取第一个子元素 -
doc.root.elements.to_a转成元素数组,方便迭代 - 用 XPath 查找:
doc.get_elements("//item[@id='1']")→ 返回匹配的元素集合
读取属性和文本内容
元素对象提供直观的方法访问结构信息:
- 获取属性值:
elem.attributes['id']或elem.attribute('id')&.value - 获取子文本(不含子标签):
elem.text(返回第一个文本节点)或elem.texts.join拼接所有文本 - 获取所有直接子元素:
elem.elements.to_a,再逐个处理
构建和输出 XML
新建文档可直接拼装,也支持添加子元素、属性和文本:
- 创建新文档:
doc = REXML::Document.newroot = doc.add_element('root')item = root.add_element('item').add_attribute('id', '2')item.text = 'B' - 输出为字符串:
puts doc.to_s(带缩进用doc.write($stdout, 2)) - 保存到文件:
File.open("out.xml", "w") { |f| doc.write(f, 2) }
基本上就这些。REXML 不复杂但容易忽略大小写敏感、命名空间需显式处理、以及空格文本节点可能干扰 text 获取 —— 实际用时注意检查 elem.has_text? 或用 elem.texts.reject(&:blank?).first 更稳妥。










