FIRST_VALUE函数用于返回窗口分区内排序后第一行的指定列值,需配合OVER子句使用,通过PARTITION BY分组、ORDER BY定义顺序,可获取每组首项数据,如最早记录或最高优先级值。

在SQL中,FIRST_VALUE 函数用于返回当前窗口分区中第一行的指定列值。它常用于分析查询中,帮助获取每组数据中的“首项”信息,比如最早记录、最高优先级值等。
理解FIRST_VALUE函数的基本语法
FIRST_VALUE 是一个窗口函数,必须配合 OVER() 子句使用。基本语法如下:
FIRST_VALUE(column_name) OVER (
[PARTITION BY partition_expression]
ORDER BY sort_expression
[ROWS/RANGE frame_clause]
)
- column_name:要取值的列,即你想获取其“首值”的字段。
- PARTITION BY(可选):将数据分组,每组独立计算首值。
- ORDER BY:必需,定义窗口内行的排序方式,决定哪一行是“第一行”。
- frame_clause(可选):控制窗口范围,默认为从分区第一行到当前行。
使用FIRST_VALUE获取首值的步骤
以下是使用该函数的典型操作流程:
- 确定你要分析的数据表和目标列,例如销售记录中的销售额或订单时间。
- 使用 ORDER BY 明确排序逻辑,如按日期升序排列以获取最早记录的值。
- 如有需要,通过 PARTITION BY 将数据划分为多个逻辑组,比如按部门或客户分组。
- 在 SELECT 中调用 FIRST_VALUE(列名),并写好 OVER 子句。
实际示例说明
假设有一张销售表 sales,包含以下字段:
employee, department, sale_amount, sale_date
我们想查看每位员工所在部门中,最早一笔销售的金额是多少。可以这样写:
SELECT
employee,
department,
sale_amount,
sale_date,
FIRST_VALUE(sale_amount) OVER (
PARTITION BY department
ORDER BY sale_date ASC
) AS first_sale_in_dept
FROM sales;
这条语句会:
- 按 department 分组;
- 在每组内按 sale_date 升序排序;
- 取出每组第一条记录的 sale_amount,赋给所有该组成员。
注意事项与常见问题
使用时注意以下几点:
- 如果不写 ORDER BY,结果不可预测,某些数据库会报错。
- 默认窗口范围是 RANGE BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW,通常能满足需求。
- 若要获取对应首行的其他信息(如姓名或时间),对那些字段也应用 FIRST_VALUE。
- 注意 NULL 值处理:如果首行值为 NULL,函数返回 NULL,可结合 COALESCE 处理。
基本上就这些。掌握排序和分组逻辑,FIRST_VALUE 能有效提取关键首项数据。










