深入了解SQL Server聚合函数算法优化
Admin 2021-09-10 群英技术资讯 547 次浏览
这篇文章主要介绍SQL Server聚合函数算法优化的小技巧,对大家学习SQL Server有一定的帮助,感兴趣的朋友可以参考下,希望大家阅读完这篇文章能有所收获,接下来小编带着大家一起了解看看。
Sql server聚合函数在实际工作中应对各种需求使用的还是很广泛的,对于聚合函数的优化自然也就成为了一个重点,一个程序优化的好不好直接决定了这个程序的声明周期。Sql server聚合函数对一组值执行计算并返回单一的值。聚合函数对一组值执行计算,并返回单个值。除了 COUNT 以外,聚合函数都会忽略空值。 聚合函数经常与 SELECT 语句的 GROUP BY 子句一起使用。
Sql server标量聚合
1.概念:在只包含聚合函数的 SELECT 语句列列表中指定的一种聚合函数(如 MIN()、MAX()、COUNT()、SUM() 或 AVG())。当列列表只包含聚合函数时,则结果集只具有一个行给出聚合值,该值由与 WHERE 子句谓词相匹配的源行计算得到。
2.探索标量聚合:
我们先用Sql server的"包括实际的执行计划"来看看一个简单的流聚合COUNT()来看看表里数据所有的行数。
再通过SET SHOWPLAN_ALL ON(关于输出中包含的列更多信息可以在链接中查看)来看看有关语句执行情况的详细信息,并估计语句对资源的需求。
通过SET SHOWPLAN_ALL ON我们来看看COUNT()具体做了那些事情:
3.标量聚合优化技巧:
我们通过两个比较简单的sql查询来看看他们的区别
SELECT COUNT(DISTINCT ShipCity) FROM OrdersSELECT COUNT(DISTINCT OrderID) FROM Orders从上图中可以看到,其实这两个查询从语句上来说没什么太大的区别,但是为什么开销会不一样,一个是查询城市一个是查询订单号。这是因为其实DISTINCT对于OrderID查询来说,是没有什么意义的,因为OrderID是主键,是不会有重复的。而ShipCity是会有重复的,Sql server的去重机制在去重的时候,会有一个排序的过程。这个排序还是比较消耗资源的。
对于数据量比较大的表其实不是很建议对大表排序或者对大表的某个重复次数多的字段去重运算。所以我们这里可以对ShipCity进行优化一下。可以对ShipCity创建一个非聚集索引。
CREATE INDEX Index_ShipCity On Orders(ShipCity desc)go从上图中可以看到,加了索引以后COUNT(DISTINCT ShipCity)的查询变成了两个流聚合,而没有了排序,节省了开销。
总结:对于标量聚合从上面的例子大家可以看到,标量聚合优缺点很明显:
Sql server哈希聚合
1.概念:
哈希(Hash,一般翻译做“散列”,也有直接音译为“哈希”的,就是把任意长度的输入(又叫做预映射, pre-image),通过散列算法,变换成固定长度的输出,该输出就是散列值。这种转换是一种压缩映射,也就是,散列值的空间通常远小于输入的空间,不同的输入可能会散列成相同的输出,所以不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。)
哈希聚合的内部实现方法和哈希连接的实现机制一样,需要哈希函数的内部运算,形成不同的哈希值,依次并行扫描数据形成聚合值。
2.背景:
为了解决流聚合的不足,应对大数据的操作,所以哈希聚合就诞生了。
3.分析:
来看看两个简单的查询。
ShipCountry和CustomerID的分组查询看上去很类似,但是为什么执行计划会不同呢?这是因为ShipCountry包含了大量的重复值,CustomerID重复值非常少,所以Sql server系统给ShipCountry推送的哈希聚合,而CustomerID推送的是流聚合。也就是说Sql server系统会动态的根据查询的情况选择合适的聚合方式。所以我们在做SQL优化的时候不能仅根据SQL语句来优化,还得结合具体数据分布的环境。
运算过程监控指标
1.监控元素:
可视化查看运行时间T-sql语句查询时间占用内存T-sql语句查询IO
2.可视化查看运行时间:
3.T-sql语句查询时间:
4.占用内存:
5.T-sql语句查询IO:
关于监控元素还有很多,这里就列举几个。
关于SQL Server聚合函数算法优化的内容就介绍到这,希望本文能帮助到大家,想要了解更多SQL Server聚合函数的内容,大家可以关注群英网络其它相关文章。
文本转载自脚本之家
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
猜你喜欢
一般,我们建立数据库表时,表数据都存放在一个文件,而对表做分区之后,就可以把一个数据文件拆分到多个数据文件中,这样有利于数据操作和提高效率。对于大量数据的数据表,我们做分区是有必要的,为了提高SQL的执行效率,做SQL优化也很重要的。
在sql server数据库中,当存储过程中运行结果,不是我们所希望的结果时,我们能够通过调用系统函数返回错误信息,raiserror函数就是使数据库服务器返回错误信息的函数,下面我们就来详细介绍下SQL server数据库中raiserror函数的用法。
数据库备份和还原是很常见的操作,一些朋友遇到高版本sql数据库备份还原低版本的需求,不知道如何解决,其实解决方法并不困难,这篇文章就给大家分享一下操作步骤,需要的朋友可以参考。
sql中stuff怎么使用?一些新手对于STUFF用法不是很清楚,下面小编就给大家介绍一下关于STUFF的作用、语法、参数和使用等等,有这方面学习需要的朋友可以参考。
SQL 撤销索引、撤销表以及撤销数据库怎样做?通过使用 DROP 语句,可以轻松地删除索引、表和数据库。下文有实例供大家参考,对大家了解操作过程或相关知识有一定的帮助,而且实用性强,希望这篇文章能帮助大家,下面我们一起来了解看看吧。
成为群英会员,开启智能安全云计算之旅
立即注册Copyright © QY Network Company Ltd. All Rights Reserved. 2003-2020 群英 版权所有
增值电信经营许可证 : B1.B2-20140078 粤ICP备09006778号 域名注册商资质 粤 D3.1-20240008