图解SQL的执行顺序


图解SQL的执行顺序

这是一条标准的查询语句:

查询语句

这是我们实际上SQL执行的顺序:

  1. 执行 from,join 来确定表之间的连接关系,得到初步的数据。
  2. where 对数据进行普通的初步的筛选
  3. group by 分组
  4. 各组分别执行 having 中的普通筛选或者聚合函数筛选
  5. 进而得到我们要的数据源,再进行 select,可以是普通字段查询也可以是获取聚合函数的查询结果,如果是聚合函数,select 的查询结果会新增一个字段。
  6. 将查询结果去重 distinct
  7. 最后合并各组的查询结果,按照 oder by 的条件进行排序

查询过程

数据关联过程

数据库中的两张表:

数据表

from&jion&where

用于确定我们要查询的表的范围,涉及那些表。
选择一张表,然后 jion 连接

from table1 jion table2 on table1.id=table2.id

用于多张表,用 where 做关联条件

from table1 jion table2 where table1.id=table2.id

我们会得到满足关联条件的两张表的数据,不加关联条件会出现笛卡尔积。

关联表

group by

按照我们的分组条件,将数据进行分组,但不会筛选数据。
比如按照 id 的奇偶分组:

id 奇偶分组

having&where

having 中可以是普通条件的筛选,也能是聚合函数,而 where 只能是聚合函数,一般情况下,有 having 可以不写 where,把 where 的筛选放在 having 里,SQL 语句看上去更顺滑。

使用 where 再 group by

先把不满足where条件的数据删除,再去分组

使用 group by 再 where

先分组再删除不满足 having 条件的数据,这两种方法有区别吗,几乎没有!
举个例子:
100/2=50,此时我们把 100 拆分 (10+10+10+10+10…)/2=5+5+5+…+5=50,只要筛选条件没变,即便是分组了也得满足筛选条件,所以 where后 group by 和 group by 再 having 是不影响结果的!

不同的是,having 语法支持聚合函数,其实 having 的意思就是针对每组的条件进行筛选。我们之前看到了普通的筛选条件是不影响的,但是having 还支持聚合函数,这是 where 无法实现的。
当前数据分组情况

当前分组情况

执行 having 的筛选条件,可以使用聚合函数。筛选掉工资小于各组平均工资的 having salary<avg(salary)

分组后的情况

select

分组结束之后,我们再执行 select 语句,因为聚合函数是依赖于分组的,聚合函数会单独新增一个查询出来的字段,这里用紫色表示,这里我们两个 id 重复了,我们就保留一个 id,重复字段名需要指向来自哪张表,否则会出现唯一性问题。最后按照用户名去重。

select employee.id,distinct name,salary, avg(salary)

select示意图

将各组having之后的数据再合并数据。

having示意图

order by

最后我们执行 order by 将数据按照一定顺序排序,比如这里按照 id 排序。如果此时有 limit 那么查询到相应的我们需要的记录数时,就不继续往下查了。

order示意图

limit

记住 limit 是最后查询的,为什么呢?假如我们要查询年级最小的三个数据,如果在排序之前就截取到 3 个数据。实际上查询出来的不是最小的三个数据而是前三个数据了,记住这一点。

我们如果limit 0,3 窃取前三个数据再排序,实际上最少工资的是2000,3000,4000。你这里只能是4000,5000,8000了。

limit示意图

参考
blog.csdn.net/weixin_44141495/article/details/108744720


文章作者: pudding
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 pudding !
  目录