Go语言XML处理核心是struct标签与xml.Unmarshaler/Marshaler接口:标签控制字段映射、属性、忽略、innerxml等;接口实现定制解析/编码逻辑,需主动调用Token方法。

Go语言通过encoding/xml包提供XML解析与编码能力,自定义行为主要靠结构体标签(struct tags)和实现特定接口(如xml.Unmarshaler和xml.Marshaler)来完成。核心在于控制字段映射、跳过字段、重命名元素、处理嵌套或特殊格式内容。
结构体字段通过xml:标签声明如何参与XML序列化/反序列化,常用选项包括:
xml:"book"让字段在XML中以<book></book>出现,而非默认的驼峰转小写加连字符xml:"-"完全跳过该字段;xml:",omitempty"仅在值为空(零值)时省略该元素或属性xml:"id,attr"将字段编码为同级元素的属性,如<book id="123"></book>
xml:",innerxml"把子元素的全部未解析内容存入字符串字段(适合混合内容或需手动处理的片段)MarshalXML实现当默认解析无法满足需求(如解析带单位的数字<size unit="cm">150</size>,或兼容多种格式),可让结构体实现UnmarshalXML(d *xml.Decoder, start xml.StartElement) error方法。
例如,解析一个带单位的尺寸字段:
立即学习“go语言免费学习笔记(深入)”;
type Size struct {
Value float64 `xml:"-"`
Unit string `xml:"unit,attr"`
}
func (s *Size) UnmarshalXML(d *xml.Decoder, start xml.StartElement) error {
// 先读取属性
for _, attr := range start.Attr {
if attr.Name.Local == "unit" {
s.Unit = attr.Value
}
}
// 再读取文本内容
token, err := d.Token()
if err != nil {
return err
}
if se, ok := token.(xml.CharData); ok {
s.Value, _ = strconv.ParseFloat(strings.TrimSpace(string(se)), 64)
}
return nil
}
类似地,实现MarshalXML(e *xml.Encoder, start xml.StartElement) error可完全控制输出格式。比如强制输出为CDATA、添加命名空间、或按业务规则生成嵌套结构。
示例:将字符串字段始终包裹在中:
func (s MyContent) MarshalXML(e *xml.Encoder, start xml.StartElement) error {
e.EncodeToken(start)
e.EncodeToken(xml.CharData([]byte(`<![CDATA[` + string(s) + `]]>`)))
e.EncodeToken(xml.EndElement{Name: start.Name})
return nil
}
对于不确定子元素类型(如<item type="book">...</item>或<item type="movie">...</item>),可先用通用结构体解析type字段,再根据值选择具体结构体二次解析;或使用xml:",any"捕获未知子元素为[]byte,再手动解码。
若需统一处理多个相似类型,可定义接口+工厂函数,避免重复判断逻辑。
基本上就这些。关键是先用好struct标签覆盖80%场景,复杂逻辑再上接口实现——不复杂但容易忽略的是:自定义方法里必须主动调用Decoder.Token()或Encoder.EncodeToken()完成实际读写,否则会卡住或遗漏内容。
以上就是Go语言怎么自定义XML元素的解析和编码的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号