基數估計（SQL Server）

基數估計邏輯稱為基數估計器，是在 SQL Server 2014 中重新設計，以改善查詢計劃的品質，因此可改善查詢效能。新的基數估算器包含適用於新式 OLTP 和數據倉儲工作負載的假設和演算法。它是以新式工作負載的深入基數估計研究為基礎，以及過去15年來改善SQL Server 基數估算器的學習。客戶的意見反應顯示，雖然大部分的查詢會因變更而受益或保持不變，但少數查詢在與之前的基數估算器相比時可能會出現退步。

備註

基數估計值是對查詢結果中行數的預測。查詢優化器會使用這些估計值來選擇執行查詢的計劃。查詢計劃的品質直接影響到改善查詢效能。

效能測試和微調建議

新的基數估算器會針對 SQL Server 2014 中建立的所有新資料庫啟用。不過，升級至 SQL Server 2014 並不會在現有的資料庫上啟用新的基數估算器。

若要確保最佳的查詢效能，請在生產系統上啟用它之前，使用這些建議來測試使用新的基數估算器的工作負載。

升級所有現有的資料庫，以使用新的基數估算器。若要這樣做，請使用 ALTER DATABASE 相容性層級（Transact-SQL）將資料庫相容性層級設定為 120。
使用新的基數預估器執行您的測試工作負載，然後用您目前處理效能問題的相同方式來解決任何新的效能問題。
一旦工作負載以新的基數估算器執行（資料庫相容性層級 120 （SQL Server 2014）），且特定查詢已回歸，您可以使用追蹤旗標 9481 執行查詢，以使用 SQL Server 2012 和更早版本中所使用的基數估算器版本。若要使用追蹤旗標執行查詢，請參閱 KB 文章在特定查詢層級啟用受不同追蹤旗標控制的 SQL Server 查詢優化器計劃影響行為。
如果您無法一次變更所有資料庫以使用新的基數估算器，您可以使用 ALTER DATABASE 相容性層級（Transact-SQL）將所有資料庫的前基數估計器設定為 110。
如果您的工作負載是以資料庫相容性層級 110 執行，而且您想要使用新的基數估算器來測試或執行特定查詢，您可以使用追蹤旗標 2312 執行查詢，以使用 SQL Server 2014 版本的基數估算器。若要使用追蹤旗標執行查詢，請參閱啟用計劃影響的 SQL Server 查詢優化器行為一文，這些行為可由特定查詢層級上的不同追蹤旗標所控制。

全新的 XEvents

有兩個新的query_optimizer_estimate_cardinality XEvent 可支援新的查詢計劃。

query_optimizer_estimate_cardinality 發生在查詢優化器估算關係表達式的基數時。
query_optimizer_force_both_cardinality_estimation_behaviors同時啟用追蹤旗標 2312 和 9481 時，嘗試同時強制使用舊基數估計行為。

範例

下列範例顯示新基數估計值的一些變更。已重寫估計基數的程序代碼。邏輯很複雜，而且無法提供所有變更的完整清單。

備註

這些範例會以概念資訊的形式提供。您不需要採取任何動作，即可變更設計資料庫和查詢的方式。

範例 A.新的基數估計值會針對最近新增的遞增數據使用平均基數

這個範例示範新的基數估算器如何改善在最近統計數據更新期間超過數據表最大值之遞增數據的基數估計值。

SELECT item, category, amount FROM dbo.Sales AS s WHERE Date = '2013-12-19';

在此範例中，新的數據列會每天新增至 Sales 數據表、查詢會要求 2013 年 12 月 19 日發生的銷售額，而統計數據上次更新為 2013/12/18。先前的基數估算器假設 12/19/2013 值不存在，因為日期超過最大日期，而且統計數據尚未更新，以包含 2013/12/19 值。如果您在當天載入數據，然後在統計數據更新之前對數據執行查詢，就會發生這種情況，稱為上升鍵問題。

此行為已變更。現在，即使自上次統計數據更新以來新增的最新遞增數據尚未更新，新的基數估計器會假設這些值存在，並使用欄位中每個值的平均基數作為基數估計值。

範例 B.新的基數估計值假設相同數據表上篩選的述詞有一些相互關聯

在此範例中，假設資料表 Cars 共有 1000 列，Make 有 200 個 'Honda' 的匹配項目，Model 有 50 個 'Civic' 的匹配項目，而且所有 'Civic' 都是 'Honda'。因此，Make 數據行中 20 個值% 為「本田」，模型數據行中值 5% 為 'Civic'，而本田 Civics 的實際數目為 50。先前基數估計值假設Make和Model資料行中的值彼此獨立。先前的查詢優化器估計有 10 輛本田思域（0.05 * 0.20 * 1000 個資料列 = 10 個資料列）。

SELECT year, purchase_price FROM dbo.Cars WHERE Make = 'Honda' AND Model = 'Civic';

此行為已變更。現在，最新的基數估計值假設 Make 和 Model 欄位有一些相互關聯。查詢優化器藉由將指數元件新增至估計方程式，以估計較高的基數。查詢優化器現在估計 22.36 個資料列（.05 * SQRT（.20） * 1000 個資料列 = 22.36 個資料列）符合條件。在此情境和特定數據分配中，22.36 行較接近查詢將傳回的實際 50 行。

請注意，新的基數估算器邏輯會排序述詞選取性，並增加指數。例如，如果述詞選取性為 .05、.20 和 .25，基數估計值會是（.05 * SQRT（.20） * SQRT（SQRT（.25））。

範例 C.新的基數估計值假設不同數據表上篩選的述詞是獨立的

在此範例中，上一個基數估算器假設述詞篩選 s.type 和 r.date 相互關聯。不過，新式工作負載上的測試結果顯示，不同數據表中數據行的述詞篩選通常不會彼此相互關聯。

SELECT s.ticket, s.customer, r.store FROM dbo.Sales AS s CROSS JOIN dbo.Returns AS r  
WHERE s.ticket = r.ticket AND s.type = 'toy' AND r.date = '2013-12-19';

此行為已變更。現在，新的基數估算器邏輯假設 s.type 與 r.date 無關。實際上，假設玩具每天都會被歸還，而不是僅在特定的一天。在此情況下，新的基數估計值會小於先前基數估計值。

另請參閱

效能的監視與微調

Last updated on 2015-11-24

共用方式為

基數估計 （SQL Server）