**后台。**我使用的是SQL Server。我的数据库中有两个表:
Vendors(Id, Name, Description)
Products(Id, VendorId, Name, Description)
Id
列中的值格式化为Vendor
表中的前缀e1d1e。
VendorId
列中的值在Products
表中使用前缀'VE_'
进行格式化。
例如Products
中的'VE_001245'
指Vendors
中的'ID_001245'
。
(请不要建议改变这个概念,不要关心数据库方案,不要建议添加外键。所有这些都只是为了说明。)
问题:以下哪种查询的性能最好?为什么?
1.在select
内部使用replace
函数:
select v.* from Vendors v
inner join
(
select distinct replace(VendorId, 'VE_', 'ID_') as Id
from Products
) list
on v.Id = list.Id
1.在on
-语句中使用replace
函数:
select v.* from Vendors v
inner join
(
select distinct VendorId as Id
from Products
) list
on v.Id = replace(list.Id, 'VE_', 'ID_')
**编辑。**每个表中只有聚集索引(按Id
列)。每个表可以包含数百万行。
1条答案
按热度按时间jecbmhm31#
这两个查询在性能方面几乎相同。在第一个查询中,排序执行了两次,一次是在选择不同的记录时,另一次是在执行内部联接时,最后是一个合并联接,用于选择最终的结果集。而在第二个查询中,排序只进行一次,但执行的是Hash Join,这比Merge Join更昂贵。因此,当您在表上没有任何索引时,这两个查询的性能是相同的。