SQL 如何用 SQL 做基础时间序列分析?

发布时间 - 2026-01-24 00:00:00    点击率:
第一步是用时间函数截断精度再GROUP BY,如PostgreSQL用DATE(created_at)或DATE_TRUNC('day', created_at),避免直接GROUP BY时间字段导致无聚合。

怎么用 GROUP BY + 时间函数做聚合切片

时间序列分析的第一步,是把原始数据按时间粒度(比如天、小时)归并。关键不是“序列”,而是“对齐”——让不同记录落在同一时间桶里再统计。

常见错误是直接 GROUP BY created_at,结果每条记录都独立成组,完全没聚合。必须先用时间函数截断精度:

  • PostgreSQL:DATE(created_at)DATE_TRUNC('day', created_at)
  • MySQL:DATE(created_at)

    DATE_FORMAT(created_at, '%Y-%m-%d')
  • SQL Server:CAST(created_at AS DATE)CONVERT(DATE, created_at)

示例:查每天订单数

SELECT DATE(order_time) AS day, COUNT(*) AS cnt
FROM orders
WHERE order_time >= '2025-01-01'
GROUP BY DATE(order_time)
ORDER BY day;

如何补全缺失日期(避免图表断点)

原始数据往往有空缺——比如某天没订单,GROUP BY 就不会返回那行,画折线图时直接断掉。必须主动构造完整日期序列再左连接。

各数据库生成连续日期的方式差异大,核心思路一致:用递归 CTE 或数字表生成日期序列,再 LEFT JOIN 原始聚合结果。

  • PostgreSQL 推荐用 GENERATE_SERIES()SELECT CURRENT_DATE - i AS day FROM GENERATE_SERIES(0, 6) AS i
  • MySQL 8.0+ 可用递归 CTE,但需设置 cte_max_recursion_depth
  • SQLite 没原生支持,得靠 UNION ALL 拼有限范围(不推荐超 30 天)

补全后记得用 COALESCE(cnt, 0) 把 NULL 转成 0,否则前端仍可能报错或渲染异常。

计算同比/环比为什么不能只靠 LAG()?

LAG() 看似能取上一行,但时间序列的“上一期”未必是物理上一行——比如你按周聚合,但某周数据缺失,LAG(cnt) 会跳到再上一周,而非严格前 7 天。

真正可靠的方案是显式关联时间偏移:

  • LEFT JOIN 关联自身,条件为 t1.day = t2.day + INTERVAL '7 days'(PostgreSQL/MySQL)
  • 或用窗口函数配合 ORDER BY day RANGE BETWEEN INTERVAL '6 days' PRECEDING AND CURRENT ROW(仅 PostgreSQL 支持 RANGE + INTERVAL)

注意:LAG() 在日期连续、无缺失时可用,但生产环境必须假设数据不全——别省这一步校验。

WHERE 和 HAVING 在时间过滤中容易搞混

想查“过去 30 天内日均订单 > 100 的产品”,有人写成:

SELECT product_id, AVG(cnt) AS avg_daily
FROM (SELECT product_id, DATE(order_time) AS day, COUNT(*) AS cnt
      FROM orders GROUP BY product_id, DATE(order_time)) t
WHERE day >= CURRENT_DATE - 30  -- ❌ 错!day 来自子查询,不是原始表字段
GROUP BY product_id
HAVING AVG(cnt) > 100;

正确做法是:时间过滤尽量在最内层作用于原始时间字段,而不是聚合后的别名;HAVING 只管聚合结果条件,不管时间范围。

更安全的写法:

SELECT product_id, AVG(daily_cnt) AS avg_daily
FROM (
  SELECT product_id, DATE(order_time) AS day, COUNT(*) AS daily_cnt
  FROM orders
  WHERE order_time >= CURRENT_DATE - INTERVAL '30 days'  -- ✅ 过滤原始时间
  GROUP BY product_id, DATE(order_time)
) t
GROUP BY product_id
HAVING AVG(daily_cnt) > 100;

时间字段的过滤层级一旦错,就可能漏数据或引入脏数据——尤其当表里有未来时间或 NULL 时间时,影响比想象中大。


# mysql  # 前端  # ai  # 为什么  # sql  # NULL  # select  # date  # union  # 递归  # 切片  # postgresql  # 数据库  # 原始数据  # 落在  # 报错  # 而非  # 不全  # 跳到  # 先用  # 每条  # 中大 


相关栏目: 【 网站优化151355 】 【 网络推广146373 】 【 网络技术251813 】 【 AI营销90571


相关推荐: Laravel定时任务怎么设置_Laravel Crontab调度器配置  如何自定义safari浏览器工具栏?个性化设置safari浏览器界面教程【技巧】  Laravel用户认证怎么做_Laravel Breeze脚手架快速实现登录注册功能  音乐网站服务器如何优化API响应速度?  Laravel如何构建RESTful API_Laravel标准化API接口开发指南  Laravel如何升级到最新版本?(升级指南和步骤)  儿童网站界面设计图片,中国少年儿童教育网站-怎么去注册?  Laravel如何为API生成Swagger或OpenAPI文档  iOS UIView常见属性方法小结  浅述节点的创建及常见功能的实现  linux写shell需要注意的问题(必看)  实例解析angularjs的filter过滤器  Win11怎么更改系统语言为中文_Windows11安装语言包并设为显示语言  使用spring连接及操作mongodb3.0实例  如何在服务器上三步完成建站并提升流量?  简历在线制作网站免费版,如何创建个人简历?  韩国网站服务器搭建指南:VPS选购、域名解析与DNS配置推荐  JS去除重复并统计数量的实现方法  Bootstrap CSS布局之列表  Laravel如何使用Collections进行数据处理?(实用方法示例)  iOS正则表达式验证手机号、邮箱、身份证号等  ,在苏州找工作,上哪个网站比较好?  Laravel策略(Policy)如何控制权限_Laravel Gates与Policies实现用户授权  js实现点击每个li节点,都弹出其文本值及修改  网站制作软件有哪些,制图软件有哪些?  Windows10如何更改计算机工作组_Win10系统属性修改Workgroup  东莞市网站制作公司有哪些,东莞找工作用什么网站好?  Laravel数据库迁移怎么用_Laravel Migration管理数据库结构的正确姿势  laravel怎么实现图片的压缩和裁剪_laravel图片压缩与裁剪方法  Java Adapter 适配器模式(类适配器,对象适配器)优缺点对比  Laravel Blade组件怎么用_Laravel可复用视图组件的创建与使用  javascript读取文本节点方法小结  网站优化排名时,需要考虑哪些问题呢?  PHP怎么接收前端传的文件路径_处理文件路径参数接收方法【汇总】  Laravel如何使用软删除(Soft Deletes)功能_Eloquent软删除与数据恢复方法  如何在 React 中条件性地遍历数组并渲染元素  Laravel如何使用Eloquent进行子查询  重庆市网站制作公司,重庆招聘网站哪个好?  Laravel软删除怎么实现_Laravel Eloquent SoftDeletes功能使用教程  网站制作大概要多少钱一个,做一个平台网站大概多少钱?  网站制作大概多少钱一个,做一个平台网站大概多少钱?  Laravel如何生成URL和重定向?(路由助手函数)  北京网站制作公司哪家好一点,北京租房网站有哪些?  Laravel如何保护应用免受CSRF攻击?(原理和示例)  制作公司内部网站有哪些,内网如何建网站?  Win11怎么关闭透明效果_Windows11辅助功能视觉效果设置  Python图片处理进阶教程_Pillow滤镜与图像增强  网站制作价目表怎么做,珍爱网婚介费用多少?  Laravel如何集成Inertia.js与Vue/React?(安装配置)  如何用JavaScript实现文本编辑器_光标和选区怎么处理