0

0

如何在Golang中开发RSS聚合阅读器CLI Go语言XML解析实战

P粉602998670

P粉602998670

发布时间:2026-03-14 15:33:01

|

484人浏览过

|

来源于php中文网

原创

根本原因是RSS命名空间未显式声明导致xml.Unmarshal忽略子元素,需在结构体字段中用完整URL映射如xml:"http://purl.org/dc/elements/1.1/ creator",并手动处理重定向、gzip解压、并发安全及缓存格式选择。

如何在golang中开发rss聚合阅读器cli go语言xml解析实战

encoding/xml 解析 RSS 2.0 时字段经常为空?

根本原因不是 XML 结构复杂,而是 RSS 常见命名空间(如 xmlns:dc="http://purl.org/dc/elements/1.1/")和混用前缀导致 xml.Unmarshal 默认忽略子元素。Go 的标准库不自动处理命名空间,也不会“猜”你想要哪个 title —— 是 channel 的还是 item 的?

  • 显式声明结构体字段的 XML 标签,尤其注意嵌套层级:XMLName xml.Name `xml:"rss"`Title string `xml:"channel>title"`
  • 对带命名空间的字段(如 dc:creator),直接按带冒号的完整名映射:Creator string `xml:"http://purl.org/dc/elements/1.1/ creator"`(注意 URL 必须写全,不能省略协议)
  • 避免用 anyinterface{} 接收未知结构 —— 它会让解析静默失败,字段全为空字符串

net/http 抓 RSS 源时遇到重定向或 gzip 崩溃?

RSS 源常返回 301/302 重定向(比如从 HTTP 跳 HTTPS),而 Go 默认的 http.DefaultClient 会自动跟随,但某些 RSS 生成器在重定向后没设好 Content-Type,导致后续解析误判编码;另外不少服务默认启用 gzip,但 xml.Unmarshal 不会自动解压。

  • 手动控制重定向:设置 Client.CheckRedirect 返回 http.ErrUseLastResponse,自己读取 resp.Header.Get("Location") 再发请求,确保最终响应头含 Content-Type: application/rss+xml
  • 强制解 gzip:检查 resp.Header.Get("Content-Encoding") == "gzip",用 gzip.NewReader(resp.Body) 包一层再传给 xml.NewDecoder
  • 别依赖 resp.Body 直接传给 xml.Decode —— 万一 Body 已被读过(比如打印了 raw body 调试),就会得到空数据

并发拉取多个 RSS 源时 panic: "invalid memory address"?

典型表现是跑几轮后在 xml.Unmarshalhttp.Do 处 panic,实际是共享了未加锁的结构体字段(比如共用一个 *http.Client 或全局切片),或在 goroutine 里直接修改了 map / slice 而没同步。

  • 每个 goroutine 应该有自己的局部变量接收解析结果,不要往同一个 []Item 里 append —— 改用 sync.WaitGroup + 闭包捕获,或收集到 channel 后统一合并
  • http.Client 本身是并发安全的,但它的 Transport 如果被手动替换(比如加了自定义 DialContext),就得确认底层连接池没被多 goroutine 错误复用
  • XML 解析过程不涉及共享状态,但如果你在 Unmarshal 后立刻修改结构体指针字段(比如补全 item.URL = feedURL),要确保该结构体没被其他 goroutine 同时读取

本地缓存 RSS 数据该用什么格式?别碰 JSON

JSON 看似方便,但 RSS 的 pubDate 格式不统一(RFC 822、RFC 850、ISO 8601 都有),Go 的 time.Time 反序列化 JSON 时容易出错;更麻烦的是,JSON 无法保留原始 XML 的命名空间信息和属性(比如 <item dc:creator="A">),下次重新聚合时元数据就丢了。

闪念贝壳
闪念贝壳

闪念贝壳是一款AI 驱动的智能语音笔记,随时随地用语音记录你的每一个想法。

下载

立即学习go语言免费学习笔记(深入)”;

  • 缓存首选二进制格式:用 gob 编码原生 Go 结构体,天然支持 time.Time 和嵌套指针,且体积小、速度快
  • 如果必须人眼可读,选 XML 本身 —— 把解析后的结构体用 xml.Marshal 写回文件,下次直接 xml.Unmarshal,零信息损失
  • 绝对避免把 map[string]interface{} 存 JSON:字段类型在反序列化时丢失,pubDate 变成 string,排序、过滤全得手动 parse

真正卡住人的从来不是怎么解析 XML,而是 RSS 源本身质量参差——有的连 </item> 都漏写,有的在 description 里塞未转义 HTML。建议在 Unmarshal 后加一层校验:检查必要字段非空、日期能 parse 成 time.Time、link 字段是合法 URL。这些细节不提前挡掉,后面聚合逻辑越写越像修仙。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
golang如何定义变量
golang如何定义变量

golang定义变量的方法:1、声明变量并赋予初始值“var age int =值”;2、声明变量但不赋初始值“var age int”;3、使用短变量声明“age :=值”等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

211

2024.02.23

golang有哪些数据转换方法
golang有哪些数据转换方法

golang数据转换方法:1、类型转换操作符;2、类型断言;3、字符串和数字之间的转换;4、JSON序列化和反序列化;5、使用标准库进行数据转换;6、使用第三方库进行数据转换;7、自定义数据转换函数。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

247

2024.02.23

golang常用库有哪些
golang常用库有哪些

golang常用库有:1、标准库;2、字符串处理库;3、网络库;4、加密库;5、压缩库;6、xml和json解析库;7、日期和时间库;8、数据库操作库;9、文件操作库;10、图像处理库。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

356

2024.02.23

golang和python的区别是什么
golang和python的区别是什么

golang和python的区别是:1、golang是一种编译型语言,而python是一种解释型语言;2、golang天生支持并发编程,而python对并发与并行的支持相对较弱等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

214

2024.03.05

golang是免费的吗
golang是免费的吗

golang是免费的。golang是google开发的一种静态强类型、编译型、并发型,并具有垃圾回收功能的开源编程语言,采用bsd开源协议。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

409

2024.05.21

golang结构体相关大全
golang结构体相关大全

本专题整合了golang结构体相关大全,想了解更多内容,请阅读专题下面的文章。

490

2025.06.09

golang相关判断方法
golang相关判断方法

本专题整合了golang相关判断方法,想了解更详细的相关内容,请阅读下面的文章。

201

2025.06.10

golang数组使用方法
golang数组使用方法

本专题整合了golang数组用法,想了解更多的相关内容,请阅读专题下面的文章。

1499

2025.06.17

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

49

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Go 教程
Go 教程

共32课时 | 6.2万人学习

Go语言实战之 GraphQL
Go语言实战之 GraphQL

共10课时 | 0.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号