إحصاءات الجدول لتجمع SQL المخصصة في تحليلات Azure Synapse
في هذه المقالة، ستجد توصيات وأمثلة لإنشاء وتحديث إحصاءات تحسين الاستعلام على الجداول في تجمع مخصص SQL.
لماذا نستخدم الإحصائيات
كلما عرف المثيل عن بياناتك، زادت سرعة تنفيذ الاستعلامات. بعد تحميل البيانات في مجموعة SQL المخصصة، يعد جمع الإحصائيات حول بياناتك أحد أهم الأشياء التي يمكنك القيام بها لتحسين استعلاماتك.
محسّن استعلام تجمع SQL المخصص هو محسّن قائم على التكلفة. يقارن تكلفة خطط الاستعلام المختلفة ثم يختار الخطة ذات أقل تكلفة. في معظم الحالات، يختار الخطة التي ستنفذ أسرع.
على سبيل المثال، في حالة قدر المحسن أن التاريخ الذي يصفي الاستعلام الخاص بك سيعيد صفا واحدا، فسيختار خطة واحدة. إذا كان يقدر أن التاريخ المحدد سيعود مليون صف، فإنه سيعود خطة مختلفة.
الإنشاء التلقائي للإحصاءات
عند تشغيل خيار AUTO_CREATE_STATISTICS قاعدة البيانات، يقوم تجمع SQL المخصص بتحليل استعلامات المستخدم الواردة للإحصائيات المفقودة.
في حالة فقدان الإحصائيات، يقوم محسن الاستعلام بإنشاء إحصائيات على أعمدة فردية في دالة تقييم الاستعلام أو حالة الربط؛ لتحسين تقديرات العلاقة الأساسية لخطة الاستعلام.
ملاحظة
يتم حاليًا تشغيل الإنشاء التلقائي للإحصائيات بشكل افتراضي.
يمكنك التحقق مما إذا كان تجمع SQL المخصص لديك قد تم تكوينه AUTO_CREATE_STATISTICS عن طريق تشغيل الأمر التالي:
SELECT name, is_auto_create_stats_on
FROM sys.databases
إذا لم يتم تكوين AUTO_CREATE_STATISTICS لتجمع SQL المخصص، نوصيك بتمكين هذه الخاصية عن طريق تشغيل الأمر التالي:
ALTER DATABASE <yourdatawarehousename>
SET AUTO_CREATE_STATISTICS ON
ستؤدي هذه العبارات إلى إنشاء الإحصائيات تلقائيًا:
- حدد .
- «إدراج - تحديد»
- CTAS
- «تحديث»:
- «حذف»
- شرح موعد الكشف عن احتواء الرابط أو وجود المسند
ملاحظة
لا يتم إنشاء الإحصائيات تلقائيًا في جداول مؤقتة أو خارجية.
يتم الإنشاء التلقائي للإحصاءات بشكل متزامن بحيث قد تتكبد أداء استعلام متدهورًا قليلًا إذا كانت أعمدتك تفتقر إلى الإحصاءات. يعتمد وقت إنشاء الإحصائيات لعمود واحد على حجم الجدول.
لتجنب تدهور الأداء القابل للقياس، يجب التأكد من إنشاء الإحصائيات أولا من خلال تنفيذ حمل العمل المعياري قبل جمع معلومات النظام.
ملاحظة
سيتم تسجيل إنشاء الإحصائيات في sys.dm_pdw_exec_requests ضمن سياق مستخدم مختلف.
عند إنشاء الإحصائيات التلقائية، ستتخذ الشكل: WA_Sys معرف عمود مكون من<8 أرقام في معرف جدول الأرقام Hex>_<8 في Hex>. يمكنك عرض الإحصائيات التي تم إنشاؤها بالفعل عن طريق تشغيل الأمر DBCC SHOW_STATISTICS:
DBCC SHOW_STATISTICS (<table_name>, <target>)
table_name هو اسم الجدول الذي يحتوي على الإحصائيات المراد عرضها. لا يمكن أن يكون هذا الجدول جدولًا خارجيًا. الهدف هو اسم الفهرس الهدف أو الإحصائيات أو العمود الذي يتم عرض معلومات الإحصائيات الخاصة به.
التحديث الخاص بالإحصائيات
أحد أفضل الممارسات هو تحديث الإحصائيات على أعمدة التاريخ كل يوم عند إضافة تواريخ جديدة. في كل مرة يتم تحميل صفوف جديدة في تجمع SQL المخصصة، يتم إضافة تواريخ تحميل جديدة أو تواريخ المعاملات. هذه الإضافات تغيير توزيع البيانات وجعل الإحصاءات قديمة.
قد لا تحتاج الإحصاءات الموجودة في عمود البلد/المنطقة في جدول العميل إلى التحديث لأن توزيع القيم لا يتغير بشكل عام. على افتراض أن التوزيع ثابت بين العملاء، فإن إضافة صفوف جديدة إلى تباين الجدول لن يغير توزيع البيانات.
ومع ذلك، إذا كان تجمع SQL المخصص يحتوي على بلد/منطقة واحدة فقط، وكنت تقوم بإحضار بيانات من بلد/منطقة جديدة، مما يؤدي إلى تخزين بيانات من بلدان/مناطق متعددة، فأنت بحاجة إلى تحديث الإحصائيات في عمود البلد/المنطقة.
وفي ما يلي توصيات تحديث الإحصاءات:
سمة الإحصائيات | التوصية |
---|---|
تردد تحديثات الإحصائيات | المحافظة: يوميا بعد تحميل البيانات الخاصة بك أو تحويلها |
أخذ نماذج | مع وجود أقل من مليار صف، استخدم أخذ العينات الافتراضية (بنسبة 20 بالمائة).
مع أكثر من مليار صف، استخدم أخذ العينات بنسبة 2 بالمائة. |
أحد الأسئلة الأولى التي يجب طرحها عند استكشاف أخطاء استعلام وإصلاحها هو " هل الإحصائيات محدثة؟"
يعتبر هذا السؤال ليس سؤالا يمكن إجابته حسب عمر البيانات. قد يكون كائن الإحصائيات المُحدَّث قديمًا إذا لم يكن هناك تغيير جوهري على البيانات الأساسية. عندما يتغير عدد الصفوف بشكل كبير، أو يحدث تغيير جوهري في توزيع القيم لعمود، فقد حان الوقت لتحديث الإحصائيات.
لا توجد طريقة عرض إدارة ديناميكية لتحديد ما إذا كانت البيانات الموجودة في الجدول قد تغيرت منذ آخر مرة تم فيها تحديث الإحصائيات. يمكن أن يساعدك الاستعلامان التاليان في تحديد ما إذا كانت إحصاءاتك قديمة.
الاستعلام 1: تعرف على الفرق بين عدد الصفوف من الإحصائيات (stats_row_count) وعدد الصفوف الفعلي (actual_row_count).
select
objIdsWithStats.[object_id],
actualRowCounts.[schema],
actualRowCounts.logical_table_name,
statsRowCounts.stats_row_count,
actualRowCounts.actual_row_count,
row_count_difference = CASE
WHEN actualRowCounts.actual_row_count >= statsRowCounts.stats_row_count THEN actualRowCounts.actual_row_count - statsRowCounts.stats_row_count
ELSE statsRowCounts.stats_row_count - actualRowCounts.actual_row_count
END,
percent_deviation_from_actual = CASE
WHEN actualRowCounts.actual_row_count = 0 THEN statsRowCounts.stats_row_count
WHEN statsRowCounts.stats_row_count = 0 THEN actualRowCounts.actual_row_count
WHEN actualRowCounts.actual_row_count >= statsRowCounts.stats_row_count THEN CONVERT(NUMERIC(18, 0), CONVERT(NUMERIC(18, 2), (actualRowCounts.actual_row_count - statsRowCounts.stats_row_count)) / CONVERT(NUMERIC(18, 2), actualRowCounts.actual_row_count) * 100)
ELSE CONVERT(NUMERIC(18, 0), CONVERT(NUMERIC(18, 2), (statsRowCounts.stats_row_count - actualRowCounts.actual_row_count)) / CONVERT(NUMERIC(18, 2), actualRowCounts.actual_row_count) * 100)
END
from
(
select distinct object_id from sys.stats where stats_id > 1
) objIdsWithStats
left join
(
select object_id, sum(rows) as stats_row_count from sys.partitions group by object_id
) statsRowCounts
on objIdsWithStats.object_id = statsRowCounts.object_id
left join
(
SELECT sm.name [schema] ,
tb.name logical_table_name ,
tb.object_id object_id ,
SUM(rg.row_count) actual_row_count
FROM sys.schemas sm
INNER JOIN sys.tables tb ON sm.schema_id = tb.schema_id
INNER JOIN sys.pdw_table_mappings mp ON tb.object_id = mp.object_id
INNER JOIN sys.pdw_nodes_tables nt ON nt.name = mp.physical_name
INNER JOIN sys.dm_pdw_nodes_db_partition_stats rg ON rg.object_id = nt.object_id
AND rg.pdw_node_id = nt.pdw_node_id
AND rg.distribution_id = nt.distribution_id
WHERE rg.index_id = 1
GROUP BY sm.name, tb.name, tb.object_id
) actualRowCounts
on objIdsWithStats.object_id = actualRowCounts.object_id
الاستعلام 2: تعرف على عمر الإحصائيات من خلال التحقق من آخر مرة تم فيها تحديث الإحصائيات في كل جدول.
ملاحظة
إذا كان هناك تغيير جوهري في توزيع القيم لعمود ما، فيجب عليك تحديث الإحصائيات بغض النظر عن آخر مرة تم فيها تحديثها.
SELECT
sm.[name] AS [schema_name],
tb.[name] AS [table_name],
co.[name] AS [stats_column_name],
st.[name] AS [stats_name],
STATS_DATE(st.[object_id],st.[stats_id]) AS [stats_last_updated_date]
FROM
sys.objects ob
JOIN sys.stats st
ON ob.[object_id] = st.[object_id]
JOIN sys.stats_columns sc
ON st.[stats_id] = sc.[stats_id]
AND st.[object_id] = sc.[object_id]
JOIN sys.columns co
ON sc.[column_id] = co.[column_id]
AND sc.[object_id] = co.[object_id]
JOIN sys.types ty
ON co.[user_type_id] = ty.[user_type_id]
JOIN sys.tables tb
ON co.[object_id] = tb.[object_id]
JOIN sys.schemas sm
ON tb.[schema_id] = sm.[schema_id]
WHERE
st.[user_created] = 1;
عادة ما تحتاج أعمدة التاريخ في تجمع SQL مخصص، على سبيل المثال، إلى تحديثات إحصائيات متكررة. في كل مرة يتم تحميل صفوف جديدة في تجمع SQL المخصصة، يتم إضافة تواريخ تحميل جديدة أو تواريخ المعاملات. هذه الإضافات تغيير توزيع البيانات وجعل الإحصاءات قديمة.
على العكس من ذلك، قد لا تحتاج الإحصائيات الخاصة بعمود الجنس في جدول العملاء إلى التحديث مطلقًا. على افتراض أن التوزيع ثابت بين العملاء، فإن إضافة صفوف جديدة إلى تباين الجدول لن يغير توزيع البيانات.
إذا كان تجمع SQL المخصص الخاص بك يحتوي على جنس واحد فقط وأدى متطلب جديد إلى أجناس متعددة، فأنت بحاجة إلى تحديث الإحصائيات في عمود الجنس.
لمزيد من المعلومات، راجع الإرشادات العامة للإحصائيات.
تنفيذ إدارة الإحصاءات
غالبًا ما يكون توسيع عملية تحميل البيانات فكرة جيدة لضمان تحديث الإحصائيات في نهاية التحميل لتجنب / تقليل الحظر أو التنازع على الموارد بين الاستعلامات المتزامنة.
يتم تحميل البيانات عندما تقوم الجداول في أغلب الأحيان بتغيير حجمها و / أو توزيعها للقيم. يعتبر تحميل البيانات مكانًا منطقيًا لتنفيذ بعض عمليات الإدارة.
يتم توفير المبادئ التوجيهية التالية لتحديث إحصاءاتك:
- تأكد من أن كل جدول تم تحميله يحتوي على كائن إحصائي واحد على الأقل محدث. يؤدي هذا إلى تحديث معلومات حجم الجدول (عدد الصفوف وعدد الصفحات) كجزء من تحديث الإحصائيات.
- ركز على الأعمدة المشاركة في جمل JOIN و GROUP BY و ORDER BY و DISTINCT.
- ضع في اعتبارك تحديث أعمدة "مفتاح تصاعدي" مثل تواريخ المعاملات بشكل متكرر، لأن هذه القيم لن يتم تضمينها في الرسم البياني للإحصاءات.
- ضع في اعتبارك تحديث أعمدة التوزيع الثابتة بشكل أقل تكرارًا.
- تذكر أن كل عنصر إحصائي يحدث بالتسلسل. التنفيذ البسيط
UPDATE STATISTICS <TABLE_NAME>
ليس دائما أمرا مثاليا، خاصة للجداول العريضة التي تحتوي على الكثير من عناصر الإحصائيات.
لمزيد من المعلومات، يرجي مراجعة تقدير العلاقة الأساسية.
أمثلة: إنشاء الإحصائيات
توضح هذه الأمثلة كيفية استخدام خيارات متنوعة من أجل إنشاء الإحصائيات. تعتمد الخيارات التي تستخدمها لكل عمود على خصائص البيانات الخاصة بك وكيفية استخدام العمود في الاستعلامات.
إنشاء إحصائيات ذات عمود واحد مع الخيارات الافتراضية
لإنشاء إحصائيات في عمود، وفر اسم لعنصر الإحصائيات واسم العمود.
يستخدم بناء الجملة هذا جميع الخيارات الافتراضية. بشكل افتراضي، يتم أخذ عينات من 20 بالمائة من الجدول عند إنشاء الإحصائيات.
CREATE STATISTICS [statistics_name] ON [schema_name].[table_name]([column_name]);
على سبيل المثال:
CREATE STATISTICS col1_stats ON dbo.table1 (col1);
إنشاء إحصائيات من عمود واحد من خلال فحص كل صف
يعد معدل أخذ العينات الافتراضي البالغ 20 بالمائة كاف لمعظم الحالات. رغم ذلك، يمكنك ضبط معدل أخذ العينات.
لأخذ عينة من الجدول الكامل، استخدم الصيغة التالية:
CREATE STATISTICS [statistics_name] ON [schema_name].[table_name]([column_name]) WITH FULLSCAN;
على سبيل المثال:
CREATE STATISTICS col1_stats ON dbo.table1 (col1) WITH FULLSCAN;
إنشاء إحصائيات ذات عمود واحد عن طريق تحديد حجم العينة
بدلاً من ذلك، يمكنك تحديد حجم العينة كنسبة مئوية:
CREATE STATISTICS col1_stats ON dbo.table1 (col1) WITH SAMPLE = 50 PERCENT;
إنشاء إحصائيات أحادية العمود على بعض الصفوف فقط
يمكنك أيضًا إنشاء إحصائيات على جزء من الصفوف في الجدول. يسمى هذا إحصائية تمت تصفيتها.
على سبيل المثال، يمكنك استخدام الإحصائيات التي تمت تصفيتها عندما تخطط للاستعلام عن قسم معين في جدول مقسم كبير. من خلال إنشاء إحصائيات حول قيم الأقسام فقط، ستتحسن دقة الإحصائيات، وبالتالي تحسن أداء الاستعلام.
ينشئ هذا المثال إحصائيات حول نطاق من القيم. يمكن تعريف القيم بسهولة لتناسب نطاق القيم في القسم.
CREATE STATISTICS stats_col1 ON table1(col1) WHERE col1 > '2000101' AND col1 < '20001231';
ملاحظة
لكي يأخذ محسن الاستعلام في الاعتبار استخدام الإحصائيات المصفاة عند اختيار خطة الاستعلام الموزعة، يجب أن يلاءم الاستعلام داخل عنصر الإحصائيات. من خلال استخدام المثال السابق، تحتاج عبارة WHERE الخاصة بالاستعلام إلى تحديد قيم col1 بين 2000101 20001231.
إنشاء إحصائيات خاصة بعمود واحد مع الخيارات الافتراضية
يمكنك أيضا الجمع بين الخيارات معا. ينشئ المثال التالي عنصر إحصائيات مصفاة بحجم عينة مخصص:
CREATE STATISTICS stats_col1 ON table1 (col1) WHERE col1 > '2000101' AND col1 < '20001231' WITH SAMPLE = 50 PERCENT;
للحصول على المرجع الكامل، يرجي مراجعة CREATE STATISTICS.
إنشاء خاص بإحصائيات متعددة الأعمدة
من أجل إنشاء عنصر إحصائيات متعدد الأعمدة، استخدم الأمثلة السابقة، ولكن حدد المزيد من الأعمدة.
ملاحظة
يتاح المدرج التكراري، المستخدم لتقدير عدد الصفوف في نتيجة الاستعلام، فقط للعمود الأول المدرج في تعريف عنصر الإحصائيات.
في هذا المثال، يوجد المدرج التكراري على product_category. يتم حساب الإحصائيات عبر الأعمدة على product_category و product_sub_category:
CREATE STATISTICS stats_2cols ON table1 (product_category, product_sub_category) WHERE product_category > '2000101' AND product_category < '20001231' WITH SAMPLE = 50 PERCENT;
نظرًا لوجود ارتباط بين product_category و product_sub_category، يمكن أن يكون عنصر الإحصائيات متعدد الأعمدة مفيدًا إذا تم الوصول إلى هذه الأعمدة في نفس الوقت.
إنشاء إحصائيات على كافة الأعمدة في جدول
تتمثل إحدى طرق إنشاء الإحصائيات في إصدار أوامر CREATE STATISTICS بعد إنشاء الجدول:
CREATE TABLE dbo.table1
(
col1 int
, col2 int
, col3 int
)
WITH
(
CLUSTERED COLUMNSTORE INDEX
)
;
CREATE STATISTICS stats_col1 on dbo.table1 (col1);
CREATE STATISTICS stats_col2 on dbo.table2 (col2);
CREATE STATISTICS stats_col3 on dbo.table3 (col3);
استخدام إجراء مخزن لإنشاء إحصائيات على كافة الأعمدة في تجمع SQL
لا يحتوي تجمع SQL المخصص على إجراء مخزن للنظام يعادل sp_create_stats في SQL Server. ينشئ هذا الإجراء المخزن عنصر إحصائيات عمود واحد على كل عمود في تجمع SQL الذي لا يحتوي بالفعل على إحصائيات.
سيساعدك المثال التالي على البدء في تصميم تجمع SQL. لا تتردد في تكييفه مع احتياجاتك.
CREATE PROCEDURE [dbo].[prc_sqldw_create_stats]
( @create_type tinyint -- 1 default 2 Fullscan 3 Sample
, @sample_pct tinyint
)
AS
IF @create_type IS NULL
BEGIN
SET @create_type = 1;
END;
IF @create_type NOT IN (1,2,3)
BEGIN
THROW 151000,'Invalid value for @stats_type parameter. Valid range 1 (default), 2 (fullscan) or 3 (sample).',1;
END;
IF @sample_pct IS NULL
BEGIN;
SET @sample_pct = 20;
END;
IF OBJECT_ID('tempdb..#stats_ddl') IS NOT NULL
BEGIN;
DROP TABLE #stats_ddl;
END;
CREATE TABLE #stats_ddl
WITH ( DISTRIBUTION = HASH([seq_nmbr])
, LOCATION = USER_DB
)
AS
WITH T
AS
(
SELECT t.[name] AS [table_name]
, s.[name] AS [table_schema_name]
, c.[name] AS [column_name]
, c.[column_id] AS [column_id]
, t.[object_id] AS [object_id]
, ROW_NUMBER()
OVER(ORDER BY (SELECT NULL)) AS [seq_nmbr]
FROM sys.[tables] t
JOIN sys.[schemas] s ON t.[schema_id] = s.[schema_id]
JOIN sys.[columns] c ON t.[object_id] = c.[object_id]
LEFT JOIN sys.[stats_columns] l ON l.[object_id] = c.[object_id]
AND l.[column_id] = c.[column_id]
AND l.[stats_column_id] = 1
LEFT JOIN sys.[external_tables] e ON e.[object_id] = t.[object_id]
WHERE l.[object_id] IS NULL
AND e.[object_id] IS NULL -- not an external table
)
SELECT [table_schema_name]
, [table_name]
, [column_name]
, [column_id]
, [object_id]
, [seq_nmbr]
, CASE @create_type
WHEN 1
THEN CAST('CREATE STATISTICS '+QUOTENAME('stat_'+table_schema_name+ '_' + table_name + '_'+column_name)+' ON '+QUOTENAME(table_schema_name)+'.'+QUOTENAME(table_name)+'('+QUOTENAME(column_name)+')' AS VARCHAR(8000))
WHEN 2
THEN CAST('CREATE STATISTICS '+QUOTENAME('stat_'+table_schema_name+ '_' + table_name + '_'+column_name)+' ON '+QUOTENAME(table_schema_name)+'.'+QUOTENAME(table_name)+'('+QUOTENAME(column_name)+') WITH FULLSCAN' AS VARCHAR(8000))
WHEN 3
THEN CAST('CREATE STATISTICS '+QUOTENAME('stat_'+table_schema_name+ '_' + table_name + '_'+column_name)+' ON '+QUOTENAME(table_schema_name)+'.'+QUOTENAME(table_name)+'('+QUOTENAME(column_name)+') WITH SAMPLE '+CONVERT(varchar(4),@sample_pct)+' PERCENT' AS VARCHAR(8000))
END AS create_stat_ddl
FROM T
;
DECLARE @i INT = 1
, @t INT = (SELECT COUNT(*) FROM #stats_ddl)
, @s NVARCHAR(4000) = N''
;
WHILE @i <= @t
BEGIN
SET @s=(SELECT create_stat_ddl FROM #stats_ddl WHERE seq_nmbr = @i);
PRINT @s
EXEC sp_executesql @s
SET @i+=1;
END
DROP TABLE #stats_ddl;
لإنشاء إحصائيات على كافة الأعمدة في الجدول باستخدام الإعدادات الافتراضية، قم بتنفيذ الإجراء المخزن.
EXEC [dbo].[prc_sqldw_create_stats] 1, NULL;
لإنشاء إحصائيات على كافة الأعمدة في الجدول باستخدام fullscan استدعاء هذا الإجراء.
EXEC [dbo].[prc_sqldw_create_stats] 2, NULL;
لإنشاء نماذج إحصائيات على كافة الأعمدة في الجدول أدخل 3 ونسبة العينة. يستخدم هذا الإجراء معدل عينة 20 بالمائة.
EXEC [dbo].[prc_sqldw_create_stats] 3, 20;
أمثلة: تحديث الإحصائيات
لتحديث الإحصائيات، يمكنك القيام بما يلي:
- تحديث خاص بعنصر إحصائي واحد. حدد اسم عنصر الإحصائيات المراد تحديثه.
- تحديث جميع عناصر الإحصائيات على جدول. حدد اسم الجدول بدلا من عنصر إحصائي واحد معين.
تحديث عنصر إحصائي واحد معين
استخدم الصيغة التالية لتحديث عنصر إحصائي معين:
UPDATE STATISTICS [schema_name].[table_name]([stat_name]);
على سبيل المثال:
UPDATE STATISTICS [dbo].[table1] ([stats_col1]);
من خلال تحديث كائنات إحصائية معينة، يمكنك تقليل الوقت والموارد المطلوبة لإدارة الإحصائيات. يتطلب القيام بذلك بعض التفكير في اختيار أفضل كائنات الإحصائيات لتحديثها.
تحديث كافة الإحصائيات في جدول
طريقة بسيطة لتحديث جميع العناصر الإحصائيات على جدول:
UPDATE STATISTICS [schema_name].[table_name];
على سبيل المثال:
UPDATE STATISTICS dbo.table1;
عبارة UPDATE STATISTICS سهلة الاستخدام. فقط تذكر أنه يقوم بتحديث كافة الإحصائيات على الجدول، وبالتالي قد يؤدي المزيد من العمل أكثر مما هو ضروري. إذا لم يكن الأداء مشكلة، فهذه هي الطريقة الأسهل والأكثر اكتمالا لضمان تحديث الإحصاءات.
ملاحظة
عند تحديث جميع الإحصائيات الموجودة في الجدول، يجري تجمع SQL المخصص مسح ضوئي لعينة الجدول لكل عنصر إحصائيات. إذا كان الجدول كبيرا ويحتوي على العديد من الأعمدة والعديد من الإحصائيات، فقد يكون تحديث الإحصائيات الفردية بناء على الحاجة أكثر فعالية.
لتنفيذ UPDATE STATISTICS
إجراء، راجع الجداول المؤقتة. أسلوب التنفيذ يختلف قليلا عن الإجراء السابق CREATE STATISTICS
ولكن النتيجة هي نفسها.
للحصول على بناء الجملة الكامل، راجع تحديث الإحصائيات.
بيانات تعريف الإحصائيات
هناك العديد من طرق عرض النظام ووظائفه التي يمكنك استخدامها للعثور على معلومات حول الإحصائيات. على سبيل المثال، يمكنك معرفة ما إذا كان كائن إحصائيات قد يكون قديما باستخدام دالة تاريخ الإحصائيات لمعرفة آخر مرة تم فيها إنشاء الإحصائيات أو تحديثها.
طرق عرض الكتالوج للإحصائيات
تتيح طرق عرض النظام هذه معلومات حول الإحصائيات:
الطريقة الخاصة بعرض الكتالوج | الوصف |
---|---|
sys.columns | صف لكل عمود. |
sys.objects | صف لكل عنصر في قاعدة البيانات. |
sys.schemas | صف لكل مخطط في قاعدة البيانات. |
sys.stats | صف لكل عنصر إحصائي. |
sys.stats_columns | صف لكل عمود في عنصر الإحصائيات. ارتباطات تعود إلى sys.columns. |
sys.tables | صف لكل جدول (يشتمل جداول خارجية). |
sys.table_types | صف لكل نوع بيانات. |
وظائف النظام من أجل الإحصائيات
تعد وظائف النظام هذه مفيدة للعمل مع الإحصائيات:
وظيفة النظام | الوصف |
---|---|
STATS_DATE | تاريخ آخر تحديث متعلق بعنصر الإحصائيات. |
DBCC SHOW_STATISTICS | مستوى الملخص ومعلومات مفصلة عن توزيع القيم كما يفهمها عنصر الإحصائيات. |
دمج الأعمدة الخاصة بالإحصائيات والدالات في طريقة عرض واحدة
تجمع طريقة العرض هذه الأعمدة المتعلقة بالإحصائيات والنتائج من وظيفة STATS_DATE () معا.
CREATE VIEW dbo.vstats_columns
AS
SELECT
sm.[name] AS [schema_name]
, tb.[name] AS [table_name]
, st.[name] AS [stats_name]
, st.[filter_definition] AS [stats_filter_definition]
, st.[has_filter] AS [stats_is_filtered]
, STATS_DATE(st.[object_id],st.[stats_id])
AS [stats_last_updated_date]
, co.[name] AS [stats_column_name]
, ty.[name] AS [column_type]
, co.[max_length] AS [column_max_length]
, co.[precision] AS [column_precision]
, co.[scale] AS [column_scale]
, co.[is_nullable] AS [column_is_nullable]
, co.[collation_name] AS [column_collation_name]
, QUOTENAME(sm.[name])+'.'+QUOTENAME(tb.[name])
AS two_part_name
, QUOTENAME(DB_NAME())+'.'+QUOTENAME(sm.[name])+'.'+QUOTENAME(tb.[name])
AS three_part_name
FROM sys.objects AS ob
JOIN sys.stats AS st ON ob.[object_id] = st.[object_id]
JOIN sys.stats_columns AS sc ON st.[stats_id] = sc.[stats_id]
AND st.[object_id] = sc.[object_id]
JOIN sys.columns AS co ON sc.[column_id] = co.[column_id]
AND sc.[object_id] = co.[object_id]
JOIN sys.types AS ty ON co.[user_type_id] = ty.[user_type_id]
JOIN sys.tables AS tb ON co.[object_id] = tb.[object_id]
JOIN sys.schemas AS sm ON tb.[schema_id] = sm.[schema_id]
WHERE 1=1
AND st.[user_created] = 1
;
أمثلة علي SHOW_STATISTICS () DBCC
تعرض SHOW_STATISTICS () DBCC البيانات المتضمنة داخل عنصر إحصائي. تأتي البيانات في ثلاثة أجزاء:
- الرأس
- المتجه الخاص بالكثافة
- المدرج التكراري
بيانات تعريف العنوان حول الإحصائيات. يعرض المدرج التكراري توزيع القيم في العمود الرئيسي الأول لعنصر الإحصائيات. يقيس متجه الكثافة الارتباط عبر الأعمدة.
ملاحظة
يحسب تجمع SQL المخصص تقديرات العلاقة الأساسية مع أي من البيانات في عنصر الإحصائيات.
إظهار العنوان والكثافة بالإضافة إلي المدرج التكراري
يوضح هذا المثال البسيط كافة الأجزاء الثلاثة لعنصر إحصائي:
DBCC SHOW_STATISTICS([<schema_name>.<table_name>],<stats_name>)
على سبيل المثال:
DBCC SHOW_STATISTICS (dbo.table1, stats_col1);
إظهار جزء أو أكثر من DBCC SHOW_STATISTICS()
في حالة اهتمامك فقط بعرض أجزاء معينة، فاستخدم العبارة WITH
وحدد الأجزاء التي تريد رؤيتها:
DBCC SHOW_STATISTICS([<schema_name>.<table_name>],<stats_name>) WITH stat_header, histogram, density_vector
على سبيل المثال:
DBCC SHOW_STATISTICS (dbo.table1, stats_col1) WITH histogram, density_vector
اختلافات DBCC SHOW_STATISTICS()
يتم تنفيذ DBCC SHOW_STATISTICS() بشكل أكثر صرامة في تجمع SQL المخصص مقارنة SQL Server:
- الميزات غير الموثقة غير مدعومة.
- يتعذر استخدام Stats_stream.
- يتعذر ضم النتائج لمجموعات فرعية معينة من بيانات الإحصائيات. على سبيل المثال، STAT_HEADER JOIN DENSITY_VECTOR.
- لا يمكن تعيين NO_INFOMSGS لمنع الرسائل.
- لا يمكن استخدام الأقواس المربعة حول أسماء الإحصائيات.
- يتعذر استخدام أسماء الأعمدة لتعريف كائنات الإحصائيات.
- الخطأ المخصص 2767 غير معتمد.
الخطوات التالية
لمزيد من تحسين أداء الاستعلام، راجع مراقبة حمل العمل الخاص بك