0

0

C#中解析RSS或Atom Feed XML 常见结构与解析要点

煙雲

煙雲

发布时间:2025-11-30 15:58:53

|

615人浏览过

|

来源于php中文网

原创

使用SyndicationFeed可统一解析RSS和Atom Feed,自动处理XML结构、命名空间与日期格式;RSS以<channel>和<item>组织数据,Atom则用<feed>和<entry>,字段如<title>、<link>、发布时间等略有差异;推荐通过XmlReader加载流并利用SyndicationFeed.Load解析,避免手动处理细节,同时注意网络请求超时控制、空值检查及HTML内容清理。

c#中解析rss或atom feed xml 常见结构与解析要点

在C#中解析RSS或Atom Feed时,了解其常见XML结构和解析方式是关键。这两种格式都基于XML,用于发布网站更新、新闻等内容,但结构略有不同。使用.NET内置的System.XmlSyndicationFeed类可以高效处理这些数据。

RSS Feed 常见结构与字段

RSS(Really Simple Syndication)通常以<rss>为根节点,版本多为2.0。主要结构如下:

  • <channel>:包含频道信息,如标题、描述、链接等
  • <title>:频道或条目标题
  • <link>:频道或文章的URL
  • <description>:频道或条目的摘要
  • <item>:每个文章条目,可有多个
  • <pubDate>:发布时间,格式通常为RFC 822
  • <guid>:唯一标识符,用于去重

示例片段:

<rss version="2.0">
  <channel>
    <title>Example Blog</title>
    <link>https://example.com</link>
    <item>
      <title>First Post</title>
      <link>https://example.com/post1</link>
      <description>This is the first article.</description>
      <pubDate>Mon, 01 Jan 2024 12:00:00 GMT</pubDate>
      <guid>https://example.com/post1</guid>
    </item>
  </channel>
</rss>

Atom Feed 常见结构与字段

Atom 使用<feed>作为根元素,遵循RFC 4287标准,结构更规范:

  • <title>:Feed或条目标题
  • <link href="..." />:使用属性表示URL,可能有多个(如self、alternate)
  • <id>:Feed或条目的唯一ID,常为URI
  • <updated>:最后更新时间,ISO 8601格式
  • <entry>:每篇文章条目
  • <published>:发布日期(可选)
  • <summary><content>:内容摘要或完整内容

示例片段:

<feed xmlns="http://www.w3.org/2005/Atom">
  <title>Example Atom Feed</title>
  <link href="https://example.com" rel="self"/>
  <updated>2024-01-01T12:00:00Z</updated>
  <entry>
    <title>First Entry</title>
    <link href="https://example.com/entry1"/>
    <id>urn:uuid:12345678-1234-4123-8234-123456789abc</id>
    <updated>2024-01-01T12:00:00Z</updated>
    <summary>This is an entry.</summary>
  </entry>
</feed>

使用 SyndicationFeed 解析(推荐方式)

.NET 提供了 SyndicationFeed 类(位于 System.ServiceModel.Syndication),可自动处理RSS和Atom,无需手动解析XML。

步骤如下:

ModelGate
ModelGate

一站式AI模型管理与调用工具

下载
  • 添加引用:using System.ServiceModel.Syndication;
  • 使用 XmlReader 读取Feed流
  • 通过 SyndicationFeed.Load(reader) 加载并解析

代码示例:

using var xmlReader = XmlReader.Create("https://example.com/feed.xml");
if (SyndicationFeed.Load(xmlReader) is SyndicationFeed feed)
{
  Console.WriteLine($"Feed Title: {feed.Title.Text}");
  foreach (var item in feed.Items)
  {
    Console.WriteLine($"- {item.Title.Text} ({item.PublishDate})");
  }
}

该方法优点:自动识别RSS/Atom、统一API、处理命名空间、日期转换等细节。

解析要点与注意事项

实际开发中需注意以下几点:

  • 网络请求应使用 HttpClient 获取Feed内容,避免直接传URL给XmlReader(不利于控制超时)
  • 某些Feed可能包含HTML内容,提取SummaryDescription时注意清理或转义
  • 日期字段格式不一,SyndicationFeed会自动转为DateTimeOffset,建议统一处理
  • Atom使用默认命名空间,手动解析时必须正确处理命名空间前缀
  • GUID或ID可能不是URL,判断重复项时需结合源标识
  • 部分Feed条目缺失字段(如无发布时间),需做空值检查

若需更高灵活性(如定制解析逻辑),也可用XDocument配合命名空间进行LINQ to XML解析,但维护成本较高。

基本上就这些。使用SyndicationFeed能覆盖大多数场景,简化开发并提高兼容性。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
if什么意思
if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词,用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章,供大家免费阅读。

847

2023.08.22

php中foreach用法
php中foreach用法

本专题整合了php中foreach用法的相关介绍,阅读专题下面的文章了解更多详细教程。

267

2025.12.04

pdf怎么转换成xml格式
pdf怎么转换成xml格式

将 pdf 转换为 xml 的方法:1. 使用在线转换器;2. 使用桌面软件(如 adobe acrobat、itext);3. 使用命令行工具(如 pdftoxml)。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1949

2024.04.01

xml怎么变成word
xml怎么变成word

步骤:1. 导入 xml 文件;2. 选择 xml 结构;3. 映射 xml 元素到 word 元素;4. 生成 word 文档。提示:确保 xml 文件结构良好,并预览 word 文档以验证转换是否成功。想了解更多xml的相关内容,可以阅读本专题下面的文章。

2119

2024.08.01

xml是什么格式的文件
xml是什么格式的文件

xml是一种纯文本格式的文件。xml指的是可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。想了解更多相关的内容,可阅读本专题下面的相关文章。

1171

2024.11.28

mysql标识符无效错误怎么解决
mysql标识符无效错误怎么解决

mysql标识符无效错误的解决办法:1、检查标识符是否被其他表或数据库使用;2、检查标识符是否包含特殊字符;3、使用引号包裹标识符;4、使用反引号包裹标识符;5、检查MySQL的配置文件等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

210

2023.12.04

Python标识符有哪些
Python标识符有哪些

Python标识符有变量标识符、函数标识符、类标识符、模块标识符、下划线开头的标识符、双下划线开头、双下划线结尾的标识符、整型标识符、浮点型标识符等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

324

2024.02.23

java标识符合集
java标识符合集

本专题整合了java标识符相关内容,想了解更多详细内容,请阅读下面的文章。

293

2025.06.11

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

26

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Bootstrap 5教程
Bootstrap 5教程

共46课时 | 3.6万人学习

AngularJS教程
AngularJS教程

共24课时 | 4.1万人学习

CSS教程
CSS教程

共754课时 | 42.7万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号