0

0

XSLT如何对节点进行分组操作?

小老鼠

小老鼠

发布时间:2025-08-24 15:05:01

|

403人浏览过

|

来源于php中文网

原创

XSLT分组主要有两种方式:XSLT 2.0+使用for-each-group指令,通过group-by等属性实现直观高效的分组;XSLT 1.0则依赖Muenchian Grouping,利用key()和generate-id()筛选每组首个节点,虽复杂但有效。

xslt如何对节点进行分组操作?

XSLT对节点进行分组操作,核心上来说,主要有两种主流方式:对于XSLT 2.0及更高版本,我们有强大的

for-each-group
指令,它极大地简化了分组逻辑;而在XSLT 1.0时代,则需要依赖一种被称为Muenchian Grouping(门兴分组)的技巧,通过
key()
函数和
generate-id()
的组合来实现。

解决方案

要对XSLT中的节点进行分组,我们通常会根据某个节点的特定属性值、子节点内容或者计算出的某个键值来组织相关的节点集合。这在数据转换中非常常见,比如把扁平化的数据转换成带有层级结构的报告。

1. XSLT 2.0+ 中的

for-each-group
指令

这是现代XSLT处理分组的首选方式,它直观且强大。

for-each-group
允许你指定一个节点集合,然后根据一个表达式对这些节点进行分组。



  

  
    
      
      
        
          
            
              
              
            
          
        
      
    
  

对应这个XML输入:


  
    Laptop
    1200
  
  
    XSLT Cookbook
    45
  
  
    Mouse
    25
  
  
    XML Basics
    30
  

输出会是:


   
      
         Laptop
         1200
      
      
         Mouse
         25
      
   
   
      
         XSLT Cookbook
         45
      
      
         XML Basics
         30
      
   

group-by
属性定义了分组的依据。
current-grouping-key()
用于获取当前组的键值,而
current-group()
则返回当前组中的所有节点。

2. XSLT 1.0 中的 Muenchian Grouping(键控分组)

在没有

for-each-group
的日子里,Muenchian Grouping是实现分组的“黑魔法”。它利用了
key()
函数能够高效查找节点,以及
generate-id()
函数为每个节点生成唯一ID的特性。其核心思想是:只处理每个分组的“第一个”节点。



  

  
  

  
    
      
      
        
        
          
          
            
              
              
            
          
        
      
    
  

使用与上面相同的XML输入,输出结果会是一致的。这里的

item[count(. | key('items-by-category', @category)[1]) = 1]
是Muenchian Grouping的精髓,它巧妙地筛选出每个分组的“领导者”节点。

XSLT 2.0+中如何使用
for-each-group
进行高效分组?

老实说,自从XSLT 2.0引入

for-each-group
,分组操作简直是鸟枪换炮,变得异常直观和强大。我个人觉得,这玩意儿是XSLT 2.0最令人拍案叫绝的特性之一,它把之前那些需要绞尽脑汁才能实现的复杂逻辑,一下子拉到了“所见即所得”的层面。

for-each-group
指令的核心在于它的几个关键属性:

  • select
    : 指定你要分组的节点集合。比如
    select="item"
    就是选择所有名为
    item
    的节点。
  • group-by
    : 这是最常用的分组方式,根据一个XPath表达式的值来分组。所有该表达式值相同的节点会被分到同一个组。
  • group-starting-with
    : 这是一个非常灵活的选项,它定义了新组的开始条件。当遇到符合这个条件的节点时,一个新的组就会从它开始。这对于处理“非结构化”的兄弟节点序列特别有用,比如HTML文档中,一个

    后面跟着若干个

    ,直到下一个

    出现。
  • group-ending-with
    : 类似于
    group-starting-with
    ,但它定义的是一个组的结束条件。
  • group-adjacent
    : 这个属性用于对相邻的、具有相同键值的节点进行分组。它和
    group-by
    有点像,但更强调“相邻”这个概念,如果中间隔了其他键值的节点,即使后面有相同键值的节点,也不会归为同一个组。

for-each-group
内部,有两个非常重要的函数:

  • current-group()
    : 返回当前正在处理的组中的所有节点。你可以像遍历普通节点集一样遍历它们。
  • current-grouping-key()
    : 返回当前组的键值。这对于在组头显示分组信息非常有用。

举个更复杂的例子,我们想分组销售订单,先按年份,再按月份:

XML输入:


  
  
  
  
  

XSLT:


  

  
    
      
      
        
          
          
            
              
              
                
                  
                
              
            
          
        
      
    
  

这个例子展示了嵌套分组的强大。我们先按年份

substring(@date, 1, 4)
分组,然后在每个年份组内,又对
current-group()
(即当前年份的所有订单)进行月份
substring(@date, 6, 2)
分组。这种层层递进的逻辑,用
for-each-group
来表达简直是水到渠成,写起来也相当顺手。

XSLT 1.0环境下,Muenchian分组模式的实现与局限性

Muenchian Grouping,这个名字听起来有点酷,但它的实现方式,对于初学者来说,绝对是XSLT 1.0时代的一个“智力挑战”。它不是一个内置指令,而是一种巧妙地利用XSLT 1.0固有功能的模式。我记得刚开始学XSLT 1.0的时候,理解这个模式花了我不少时间,因为它确实有点反直觉。

汕头吧网上商城系统
汕头吧网上商城系统

特点与优点:1.界面布局合理美观,浏览方便,更具商城站点的风格;2.前后台功能强大好用,如三级分类、竞拍、排行榜、特价、促销、积分等;3.更具人性化,如定单反馈、会员与VIP分别显示不同的售价等;4.优化程序代码,执行速度快速;5.不错的短信联络管理员以及留言本的悄悄话功能等。功能介绍:商品的添加、修改、删除。 管理商品的订单及修改订单状态和网友对商品的评论。管理网站前台用户,可进行修改、删除操作

下载

核心思想:

  1. 定义键(
    xsl:key
    : 使用
    xsl:key
    来创建一个索引,将所有需要分组的节点与它们的“分组键”关联起来。
  2. 找到每个组的“头”节点: 这是最关键的一步。我们遍历所有节点,但只选择那些在
    key()
    函数返回的节点集中,它自己就是第一个节点的。
    count(. | key('your-key', your-criteria)[1]) = 1
    就是这个魔法表达式。
    • key('your-key', your-criteria)
      :返回所有符合
      your-criteria
      的节点。
    • key('your-key', your-criteria)[1]
      :返回这些节点中的第一个。
    • count(. | ...)
      :这是一个集合运算,计算当前节点和第一个节点合并后的节点数量。如果当前节点就是第一个节点,那么合并后节点数量是1;如果不是,合并后节点数量是2。所以,
      = 1
      就筛选出了每个组的第一个节点。
  3. 遍历组内成员: 找到组头后,再次使用
    key()
    函数,传入组头的键值,就能获取该组的所有成员。

我们还是用之前的商品分类XML来演示Muenchian Grouping:


  
    Laptop
    1200
  
  
    XSLT Cookbook
    45
  
  
    Mouse
    25
  
  
    XML Basics
    30
  

XSLT 1.0 (Muenchian Grouping):



  

  
  

  
    
      
      
        
        
          
          
            
              
              
            
          
        
      
    
  

局限性:

  1. 复杂性高: 表达式
    item[count(. | key('items-by-category', @category)[1]) = 1]
    对于不熟悉XSLT 1.0技巧的人来说,确实难以理解和记忆。维护起来也容易出错。
  2. 可读性差: 相比
    for-each-group
    的语义化,Muenchian Grouping的代码看起来更像是一种“黑客行为”,而不是清晰的意图表达。
  3. 性能考量: 虽然
    key()
    函数本身是优化的,但在处理超大型文档时,反复调用
    key()
    可能会带来一定的性能开销。
  4. 不支持复杂分组条件: Muenchian Grouping主要适用于基于单一键值的分组。像
    group-starting-with
    那种基于节点位置和上下文的分组,用Muenchian Grouping实现起来会异常困难,甚至不可能。
  5. 嵌套分组的挑战: 虽然可以实现,但嵌套的Muenchian Grouping会使得表达式更加复杂,代码更难维护。

尽管有这些局限性,但对于那些仍然运行在XSLT 1.0环境下的系统来说,Muenchian Grouping依然是不可或缺的技能。它证明了即使在语言特性有限的情况下,开发者也能通过巧妙的组合实现复杂的功能。

除了基本分组,XSLT还能实现哪些复杂的节点分组场景?

XSLT的分组能力远不止是简单地按一个字段值来归类。在实际项目中,我遇到过各种稀奇古怪的分组需求,有些真的需要跳出常规思维去解决。这正是XSLT的魅力所在,它提供了一套工具集,让你能像搭积木一样,构建出满足特定业务逻辑的转换。

  1. 连续兄弟节点分组(

    group-starting-with
    的妙用) 这是我个人觉得
    for-each-group
    最出彩的地方之一,尤其是在处理半结构化文档(比如HTML)时。想象一下,你有一段HTML,里面有标题

    ,后面跟着几个段落

    ,然后又是另一个

    。你希望把每个

    和它后面的所有

    (直到下一个

    出现)作为一个组。

    XML输入 (模拟HTML片段):

    
      

    Section A

    Content for A, paragraph 1.

    Content for A, paragraph 2.

    Section B

    Content for B, paragraph 1.

    • List item 1
    • List item 2

    Content for B, paragraph 2.

    Section C

    Content for C.

    XSLT (使用

    group-starting-with
    ):

    
      
    
      
        
          
          
            

    这里,

    group-starting-with="h2"
    告诉XSLT,每当遇到一个

    节点,就开启一个新的组。这个组会包含

    本身,以及它后面所有的兄弟节点,直到遇到下一个

    为止。这对于将扁平的HTML结构转换为逻辑上的章节结构非常有效。

  2. 基于动态或计算值的分组 有时候,分组的依据不是一个简单的属性值,而是一个需要计算出来的结果。比如,我们想把商品按照价格区间(0-50, 51-100, 101-200等)来分组。

    XSLT (计算价格区间):

    
      
    
      
        
          
    													

    相关文章

    相关标签:

    本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
counta和count的区别
counta和count的区别

Count函数用于计算指定范围内数字的个数,而CountA函数用于计算指定范围内非空单元格的个数。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

198

2023.11.20

pdf怎么转换成xml格式
pdf怎么转换成xml格式

将 pdf 转换为 xml 的方法:1. 使用在线转换器;2. 使用桌面软件(如 adobe acrobat、itext);3. 使用命令行工具(如 pdftoxml)。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1903

2024.04.01

xml怎么变成word
xml怎么变成word

步骤:1. 导入 xml 文件;2. 选择 xml 结构;3. 映射 xml 元素到 word 元素;4. 生成 word 文档。提示:确保 xml 文件结构良好,并预览 word 文档以验证转换是否成功。想了解更多xml的相关内容,可以阅读本专题下面的文章。

2094

2024.08.01

xml是什么格式的文件
xml是什么格式的文件

xml是一种纯文本格式的文件。xml指的是可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。想了解更多相关的内容,可阅读本专题下面的相关文章。

1084

2024.11.28

2026赚钱平台入口大全
2026赚钱平台入口大全

2026年最新赚钱平台入口汇总,涵盖任务众包、内容创作、电商运营、技能变现等多类正规渠道,助你轻松开启副业增收之路。阅读专题下面的文章了解更多详细内容。

59

2026.01.31

高干文在线阅读网站大全
高干文在线阅读网站大全

汇集热门1v1高干文免费阅读资源,涵盖都市言情、京味大院、军旅高干等经典题材,情节紧凑、人物鲜明。阅读专题下面的文章了解更多详细内容。

43

2026.01.31

无需付费的漫画app大全
无需付费的漫画app大全

想找真正免费又无套路的漫画App?本合集精选多款永久免费、资源丰富、无广告干扰的优质漫画应用,涵盖国漫、日漫、韩漫及经典老番,满足各类阅读需求。阅读专题下面的文章了解更多详细内容。

60

2026.01.31

漫画免费在线观看地址大全
漫画免费在线观看地址大全

想找免费又资源丰富的漫画网站?本合集精选2025-2026年热门平台,涵盖国漫、日漫、韩漫等多类型作品,支持高清流畅阅读与离线缓存。阅读专题下面的文章了解更多详细内容。

12

2026.01.31

漫画防走失登陆入口大全
漫画防走失登陆入口大全

2026最新漫画防走失登录入口合集,汇总多个稳定可用网址,助你畅享高清无广告漫画阅读体验。阅读专题下面的文章了解更多详细内容。

13

2026.01.31

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
React 教程
React 教程

共58课时 | 4.4万人学习

Pandas 教程
Pandas 教程

共15课时 | 1.0万人学习

ASP 教程
ASP 教程

共34课时 | 4.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号