MySQL窗口函数使用心得

描述

前言

目前生产环境中MySQL一直使用的是5.7版本,不敢贸然升级版本,涉及数据结构、数据备份等内容。但看到各大平台分享的Mysql8的新版本特性,按捺不住强烈的好奇心,于是在本地搭建了Mysql服务,实际验证了一部分新功能,确实带给我新的认知。接下来就分享给大家使用心得。

概述

  • Mysql是小编从事开发行业三年多来,接触的最多的数据存储介质,它属于关系型数据库,以开源免费、体积小、速度快、使用成本低等优点,深得大部分用户喜爱,同时也受很多公司青睐。
  • 自从8.0.11正式版本发布以来,不知不觉已经有四年多的时间,官方号称比5.7版本快两倍(读写负载、IO密集型任务负载、高竞争负载等),同时新增了窗口函数(实现类似集合函数的新型查询方式)等。下面将从窗口函数特性进行详细介绍。

窗口函数

  • 窗口函数又名OLAP函数(Online Anallytical Processing,联机分析处理),用来实时分析处理数据;
  • 通用语法:select 窗口函数 over (partition by 分组列名, order by 排序列名)
  • 专用窗口函数:
    • rank函数:如按班级名称分类,按序号正序,用rank函数实现,相同序号会出现并列ranking值
SELECT *, RANK() over (partition by `NAME` ORDER BY NUM) as ranking FROM f0627

  结果
  name num ranking
  A      1  1
  A      2  2
  A      3  3
  A      4  4
  A      6  5
  B      2  1
  B      2  1
  B      8  3

  sql说明:rank为排序函数,通过partition by按照班级名称分组(此处不会类似group by将数据去重),然后按照序号正序,最后得到的rangking字段就是分类后的排序结果。
  • row_number函数:同样如按班级名称分类,按序号正序,会忽略相同序号,顺序生成ranking值
SELECT *, ROW_NUMBER() over (partition by `NAME` ORDER BY NUM) as ranking FROM f0627

  结果
  name num ranking
  A      1  1
  A      2  2
  A      3  3
  A      4  4
  A      6  5
  B      2  1
  B      2  2
  B      8  3

  sql说明:rank为排序函数,通过partition by按照班级名称分组(此处不会类似group by将数据去重),然后按照序号正序,最后得到的rangking字段就是分类后的排序结果,观察ranking结果忽略了并列情况。
  • 聚合窗口函数:
    • sum()函数:如按班级名称分类,按序号正序,累加序号,将分类后第一行至当前行的累加结果汇总至‘求和’字段
SELECT *, SUM(NUM) over (partition by `NAME` ORDER BY NUM) as '求和' FROM f0627

   结果
   name num 求和
   A   1   1
   A   2   3
   A   3   6
   A   4   10
   A   6   16
   B   2   2
   B   2   4
   B   8   12

  sql说明:sum()为求和函数,通过partition by按照班级名称分组(此处不会类似group by将数据去重),然后按照序号正序,将每种分类第一行至当前行的序号累加结果汇总至‘求和’字
  • avg()函数:在上面sum函数基础上,增加avg函数计算平均值
SELECT *, SUM(NUM) over (partition by `NAME` ORDER BY NUM) as '求和', AVG(NUM) over (partition by `NAME` ORDER BY NUM) as '平均' FROM f0627

   结果
   name num 求和 平均
   A   1   1    1.0000
   A   2   3    1.5000
   A   3   6    2.0000
   A   4   10    2.5000
   A   6   16    3.2000
   B   2   2    2.0000
   B   2   4    2.0000
   B   8   12    4.0000

  sql说明:avg()为平均值函数,通过partition by按照班级名称分组(此处不会类似group by将数据去重),然后按照序号正序,将每种分类第一行至当前行的序号累加结果求平均值至‘平均’字段
  • CTE表达式(Common Table Expressions,通用表表达式):结合窗口函数使得复杂的嵌入查询更加清晰,提高了可读性
    • 求平均值案例
WITH cte as (SELECT *, SUM(NUM) over (partition by `NAME` ORDER BY NUM) as suming, AVG(NUM) over (partition by `NAME` ORDER BY NUM) as avging FROM f0627)
SELECT * FROM cte where avging > 2

    结果
    name num suming avging
    A   4    10    2.5000
    A   6    16    3.2000
    B   8    12    4.0000

    sql说明:with cte as (sql) 将sql结果可以定义为cte的派生表,可以直接查询派生表过滤平均值大于2的结果。

总结

  • Mysql 8.0新增的窗口函数极大简化了sql实现语句,实现了更加复杂的数据逻辑,可以满足更多的开发场景,从而相应减少了代码开发成本。
  • 当窗口函数结合cte使用时,可以将嵌套查询分层,使得语句可读性更高,当然性能也是有保证的。
打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分