我真的不知道CHECKSUM_AGG()如何工作,虽然我知道它是通过使用XOR以某种方式构建的.这解释了为什么当你传递相等的整数时它返回0.
但是为什么我在以下SQL中获得相同的聚合校验和,其中输入值是唯一的?
DECLARE @test1 TABLE (chksum INT)
INSERT INTO @test1 VALUES (2147473855), (2147473343)
SELECT CHECKSUM_AGG(chksum)
FROM @test1
DECLARE @test2 TABLE (chksum INT)
INSERT INTO @test2 VALUES (2147474831), (2147472271)
SELECT CHECKSUM_AGG(chksum)
FROM @test2
非常感谢您的解释.谢谢!
最佳答案 SQL Server CHECKSUM和CHECKSUM_AGG实现存在已知问题:
CHECKSUM weakness explained
请改用HASHBYT:Using HASHBYTES to compare columns
从Microsoft:
如果表达式列表中的某个值发生更改,则列表的校验和通常也会更改.但是,校验和不会发生变化的可能性很小.因此,我们不建议使用CHECKSUM来检测值是否已更改,除非您的应用程序可以容忍偶尔错过更改.请考虑使用HashBytes.当指定MD5哈希算法时,HashBytes为两个不同输入返回相同结果的概率远低于CHECKSUM.
您可能不会直接跨行使用HASHBYTES – 有一个解决方法here.
以下是较小数字的比较,使用HASBYTES解决方法:
DECLARE @test1 TABLE (chksum INT)
DECLARE @test2 TABLE (chksum INT)
INSERT INTO @test1 VALUES (50), (3), (26)
INSERT INTO @test2 VALUES (45), (0), (6)
SELECT [Values] = '50, 3, 26',
[Checksum] = CHECKSUM_AGG(chksum),
-- HashBytes is limited to 8000 bytes only
[Hashbytes] = HashBytes('md5',convert(varbinary(max),(SELECT * FROM @test1 FOR XML AUTO)))
FROM @test1
UNION ALL
SELECT [Values] = '45, 0, 6',
[Checksum] = CHECKSUM_AGG(chksum),
-- HashBytes is limited to 8000 bytes only
[Hashbytes] = HashBytes('md5',convert(varbinary(max),(SELECT * FROM @test2 FOR XML AUTO)))
FROM @test2