Понимание статистики на столбцах UNIQUEIDENTIFIER в SQL Server

Во время недавней конференции SQLRally была интересная дискуссия о поведении SQL Server в отношении статистики на столбцах UNIQUEIDENTIFIER. Эта статья призвана прояснить эту тему.

Давайте начнем с рассмотрения простого определения таблицы с столбцом UNIQUEIDENTIFIER в качестве первичного ключа:

CREATE TABLE CustomersTableGuid
(
ID UNIQUEIDENTIFIER NOT NULL PRIMARY KEY,
FirstName VARCHAR(50),
LastName VARCHAR(50)
)

Когда на столбце UNIQUEIDENTIFIER накладывается ограничение первичного ключа, SQL Server генерирует уникальный кластеризованный индекс в фоновом режиме. У этого кластеризованного индекса есть подлежащий объект Statistics, который описывает распределение данных в этом столбце.

Теперь давайте вставим 1 миллион строк в эту таблицу:

DECLARE @i INT = 0
WHILE (@i < 1000000)
BEGIN
    INSERT INTO CustomersTableGuid (ID, FirstName, LastName)
    VALUES (NEWID(), 'John', 'Doe')
    SET @i = @i + 1
END

Затем мы обновляем статистику на этой таблице с помощью FULLSCAN. FULLSCAN означает, что SQL Server сканирует все подлежащие данные для обновления объекта статистики:

UPDATE STATISTICS CustomersTableGuid WITH FULLSCAN

Однако, когда мы смотрим на объект Statistics сейчас, мы видим, что SQL Server сгенерировал только 3 шага в гистограмме. Это удивительно, учитывая, что все 1 миллион строк были отобраны во время обновления статистики:

Но когда мы обновляем объект Statistics с меньшим интервалом выборки, все начинает меняться:

UPDATE STATISTICS CustomersTableGuid WITH SAMPLE 50 PERCENT

Теперь, когда мы смотрим на гистограмму, мы видим, что у нас есть много разных шагов:

Это поведение может быть довольно удивительным, но важно понимать, что пока значения в столбце UNIQUEIDENTIFIER являются уникальными, не должно возникать проблем с производительностью. Строка AVG_RANGE_ROW все равно делает правильную оценку 1 строки для огромного количества пробелов в гистограмме.

Так что, работая со столбцами UNIQUEIDENTIFIER в вашем проекте базы данных, имейте это поведение в виду. Всегда полезно анализировать и понимать статистику на ваших столбцах, чтобы обеспечить оптимальную производительность.

Спасибо за чтение!

– Ваш автор блога о SQL Server

Click to rate this post!

[Total: 0 Average: 0]

Comprehensive 360 Degree Assessment

Data Replication

Performance Optimization

Data Security

Database Migration

Expert Consultation

Cloud Migration Made Easy

Considering a move to the cloud? Axial SQL brings you proven migration strategies to streamline your transition. Our expert team ensures a smooth, efficient shift, keeping your data safe and accessible. Start your journey to the cloud with confidence!

SQL Performance Optimization

Is your SQL running slower than expected? Don't let sluggish performance hinder your business. Our optimization experts at Axial SQL specialize in tuning your databases for peak performance. Speed up your SQL and supercharge your data processing today!

Database Stability Solutions

Tired of frequent database outages? Discover stability with Axial SQL! Our comprehensive analysis identifies and resolves your database vulnerabilities. Enhance reliability, reduce downtime, and keep your operations running smoothly with our expert guidance.

Expert Database Team Evaluation

Questioning your database team's efficiency? Let Axial SQL provide an expert, unbiased analysis. We assess your team's strategies and workflows, offering insights and improvements to boost productivity. Elevate your database management to new heights!

Data Security Assurance

Concerned about your database security? Axial SQL is here to fortify your data defenses. Our specialized security assessments identify potential risks and implement robust protections. Keep your sensitive data secure and your peace of mind intact with our expert services.

Published on

Понимание статистики на столбцах UNIQUEIDENTIFIER в SQL Server

Let's work together