0

0

SQL 如何计算新增、留存与流失?

冷漠man

冷漠man

发布时间:2026-01-23 19:07:02

|

127人浏览过

|

来源于php中文网

原创

新增用户按用户首次关键行为时间归因,需用MIN(event_time)或ROW_NUMBER()识别各user_id最早行为,而非仅统计某日注册数;次日留存须统一活跃定义并严格时区对齐;流失判定应基于已建立活跃习惯的用户池及业务校准周期。

sql 如何计算新增、留存与流失?

新增用户怎么算:按首次行为时间切片

新增用户不是看某天登录的人数,而是看「第一次发生关键行为」的用户。比如注册、下单、激活设备等。关键在于识别每个用户的最早行为时间,再按该时间归入对应日期。

  • 必须用 MIN(event_time) 或窗口函数 ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY event_time) 找出每个 user_id 的首行为
  • 如果只用 WHERE event_time = '2024-05-01' 统计当天注册数,会漏掉那些注册后没再活跃的“静默新增”
  • 常见错误是把「当日新注册用户数」和「当日首次下单用户数」混为一谈——它们属于不同事件类型,需分别定义“新增”的业务口径
SELECT 
  DATE(MIN(event_time)) AS first_active_date,
  COUNT(DISTINCT user_id) AS new_users
FROM events 
GROUP BY DATE(MIN(event_time))

次日留存率为什么总不准:时间对齐和去重逻辑最关键

次日留存 = 「第1天活跃且第2天也活跃的用户数」 ÷ 「第1天活跃用户数」。问题常出在:没统一用「活跃」定义(是登录?是访问页面?是完成订单?),或没排除测试账号/机器人流量。

  • 分子必须是同一组 user_id 在两个自然日都满足活跃条件,不能简单用 COUNT(*) 汇总
  • 推荐用自连接或 LAG() 窗口函数:先按 user_id, DATE(event_time) 去重,再判断相邻日期是否存在
  • 注意时区:如果数据是 UTC 时间,但业务看的是北京时间,直接用 DATE(event_time) 会导致跨日错位
WITH daily_active AS (
  SELECT DISTINCT user_id, DATE(event_time) AS dt
  FROM events 
  WHERE event_type = 'page_view'
)
SELECT 
  d1.dt AS cohort_date,
  COUNT(DISTINCT d1.user_id) AS day1_active,
  COUNT(DISTINCT d2.user_id) AS day2_retained,
  ROUND(COUNT(DISTINCT d2.user_id) * 1.0 / NULLIF(COUNT(DISTINCT d1.user_id), 0), 3) AS retention_rate
FROM daily_active d1
LEFT JOIN daily_active d2 
  ON d1.user_id = d2.user_id AND d2.dt = DATE_ADD(d1.dt, INTERVAL 1 DAY)
GROUP BY d1.dt

流失用户容易被误判:别只看“最近一次行为”

流失 ≠ “今天没来”。典型错误是写 WHERE last_active_time 就标为流失,这会把刚注册还没来得及活跃的新用户也打上标签。

通义千问
通义千问

阿里巴巴推出的全能AI助手

下载
  • 流失应基于「预期活跃周期」:比如电商用户平均3天回访,SaaS用户平均7天登录,这个周期要从业务中校准,不能拍脑袋定
  • 更稳妥的做法是:先圈定「已建立活跃习惯的用户池」(如过去30天至少活跃5天),再从中筛选「最近N天完全无行为」的用户
  • 注意区分「暂时沉默」和「永久流失」:后者通常伴随明确退出信号,如退订邮件、注销账号、关闭推送权限,这些事件比单纯不活跃更有判据价值

用 UNION ALL 拼留存漏斗时,字段顺序和类型必须严格一致

有人想把新增、7日留存、30日留存合并成一张宽表,用 UNION ALL 堆叠,结果报错或数值错乱。

  • UNION ALL 不检查列名,只按位置匹配字段,SELECT 'new' AS metric, cnt FROM t1SELECT cnt, 'ret7' FROM t2 会把 cnt 当 metric,'ret7' 当数值
  • 所有子查询必须保证列数、顺序、数据类型一致;推荐显式写出列名并用 CAST 对齐,比如都转成 DECIMAL(5,3)
  • 复杂留存分析建议改用 CTE + 条件聚合,比反复 UNION ALL 更易读、更少出错

真正难的不是写 SQL,而是对齐业务定义:新增以哪个事件为准?留存从哪天开始算?流失的冷静期设几天?这些一旦没对齐,再漂亮的查询结果也是误导。

相关专题

更多
数据分析工具有哪些
数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍:1、Excel,具有强大的计算和数据处理功能;2、SQL,可以进行数据查询、过滤、排序、聚合等操作;3、Python,拥有丰富的数据分析库;4、R,拥有丰富的统计分析库和图形库;5、Tableau,提供了直观易用的用户界面等等。

685

2023.10.12

SQL中distinct的用法
SQL中distinct的用法

SQL中distinct的语法是“SELECT DISTINCT column1, column2,...,FROM table_name;”。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

323

2023.10.27

SQL中months_between使用方法
SQL中months_between使用方法

在SQL中,MONTHS_BETWEEN 是一个常见的函数,用于计算两个日期之间的月份差。想了解更多SQL的相关内容,可以阅读本专题下面的文章。

348

2024.02.23

SQL出现5120错误解决方法
SQL出现5120错误解决方法

SQL Server错误5120是由于没有足够的权限来访问或操作指定的数据库或文件引起的。想了解更多sql错误的相关内容,可以阅读本专题下面的文章。

1117

2024.03.06

sql procedure语法错误解决方法
sql procedure语法错误解决方法

sql procedure语法错误解决办法:1、仔细检查错误消息;2、检查语法规则;3、检查括号和引号;4、检查变量和参数;5、检查关键字和函数;6、逐步调试;7、参考文档和示例。想了解更多语法错误的相关内容,可以阅读本专题下面的文章。

359

2024.03.06

oracle数据库运行sql方法
oracle数据库运行sql方法

运行sql步骤包括:打开sql plus工具并连接到数据库。在提示符下输入sql语句。按enter键运行该语句。查看结果,错误消息或退出sql plus。想了解更多oracle数据库的相关内容,可以阅读本专题下面的文章。

717

2024.04.07

sql中where的含义
sql中where的含义

sql中where子句用于从表中过滤数据,它基于指定条件选择特定的行。想了解更多where的相关内容,可以阅读本专题下面的文章。

577

2024.04.29

sql中删除表的语句是什么
sql中删除表的语句是什么

sql中用于删除表的语句是drop table。语法为drop table table_name;该语句将永久删除指定表的表和数据。想了解更多sql的相关内容,可以阅读本专题下面的文章。

419

2024.04.29

c++空格相关教程合集
c++空格相关教程合集

本专题整合了c++空格相关教程,阅读专题下面的文章了解更多详细内容。

0

2026.01.23

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
10分钟--Midjourney创作自己的漫画
10分钟--Midjourney创作自己的漫画

共1课时 | 0.1万人学习

Midjourney 关键词系列整合
Midjourney 关键词系列整合

共13课时 | 0.9万人学习

AI绘画教程
AI绘画教程

共2课时 | 0.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号