分享方式:


記憶體內部 OLTP 的初始區域調查

適用於:SQL Server、Azure SQL 資料庫 和 Azure SQL 受控執行個體。

本文適用的對象是急著學習 Microsoft SQL Server 和 Azure SQL 資料庫的記憶體內部 OLTP 效能功能基本概念的開發人員。

本文提供下列記憶體內部 OLTP 資訊:

  • 功能的快速說明。
  • 實作功能的核心程式碼範例。

SQL Server 和 SQL Database 在它們對記憶體內部技術的支援上只有微小差異。

在現實世界裡,某些部落客會將記憶體內部 OLTP 稱為 Hekaton

記憶體內部功能的優點

SQL Server 提供記憶體內部功能,以大幅改進許多應用程式系統的效能。 本節說明最直接的考量。

OLTP (線上交易處理) 的功能

必須同時處理大量 SQL INSERT 的系統是 OLTP 功能的絕佳候選項目。

  • 我們的基準測試顯示若採用記憶體內部功能,可將速度從 5 倍加快到 20 倍。

處理 Transact-SQL 中大量計算的系統是絕佳候選項目。

  • 專用於大量計算之預存程序的執行速度最快可以高達 99 倍。

您稍後可以瀏覽下列示範記憶體內部 OLTP 效能提升的各篇文章:

作業分析的功能

記憶體內部分析指的是彙總交易資料的 SQL SELECT,通常是透過包含 GROUP BY 子句。 稱為 columnstore 的索引類型是作業分析的核心。

有兩個主要案例︰

  • 「批次作業分析」 指的是在營業時間後或在具有交易資料複本的次要硬體上執行的彙總程序。
  • 「即時作業分析」指的是在營業時間內以及在用於交易工作負載的主要硬體上執行的彙總程序。

目前文章的焦點是放在 OLTP,而不是分析。 如需資料行存放區索引如何將分析帶入 SQL 的資訊,請參閱:

columnstore

這一系列的優質部落格文章從多種角度清楚說明資料行存放區索引。 大部分文章進一步描述資料行存放區索引支援的即時作業分析概念。 這些文章由 Microsoft 專案經理 Sunil Agarwal 於 2016 年 3 月撰寫。

即時作業分析

  1. 即時作業分析使用記憶體內部技術
  2. 即時作業分析 - 概覽非叢集資料行存放區索引 (NCCI)
  3. 即時作業分析:在 SQL Server 2016 中使用非叢集資料行存放區索引 (NCCI) 的簡單範例 \(英文\)
  4. 即時作業分析:SQL Server 2016 中的 DML 作業與非叢集資料行存放區索引 (NCCI) \(英文\)
  5. 即時作業分析:經過篩選的非叢集資料行存放區索引 (NCCI) \(英文\)
  6. 即時作業分析:非叢集資料行存放區索引 (NCCI) 的壓縮延遲選項
  7. 即時作業分析:使用 NCCI 的壓縮延遲選項與效能 \(英文\)
  8. 即時作業分析:記憶體最佳化資料表與資料行存放區索引

重組資料行存放區索引

  1. 使用 REORGANIZE 命令的資料行存放區索引磁碟重組
  2. REORGANIZE 的資料行存放區索引合併原則

資料大量匯入

  1. 叢集資料行存放區:大量載入 \(英文\)
  2. 叢集資料行存放區索引:資料載入最佳化 - 最低限度記錄 \(英文\)
  3. 叢集資料行存放區索引:資料載入最佳化 - 平行大量匯入 \(英文\)

記憶體內部 OLTP 的功能

請查看記憶體內部 OLTP 的主要功能。

記憶體最佳化的資料表

CREATE TABLE 陳述式上的 T-SQL 關鍵字 MEMORY_OPTIMIZED 是建立資料表使其存在於使用中的記憶體上而非磁碟上的方式。

記憶體最佳化資料表 會在使用中記憶體中有一個代表它自己的表示方式,並在磁碟中有第二個表示方式副本。

  • 磁碟副本是在伺服器或資料庫關機然後重新啟動之後用於例行復原。 您和您的程式碼完全看不到這個記憶體加磁碟雙重性。

原生編譯模組

CREATE PROCEDURE 陳述式上的 T-SQL 關鍵字 NATIVE_COMPILATION 是建立原生編譯預存程序的方式。 每次資料庫重新上線時,都會在第一次使用原生處理序時將 T-SQL 陳述式編譯成機器碼。 T-SQL 指令無法再忍受緩慢解譯每個指令。

  • 我們已經看到原生編譯可讓持續時間只有解譯之持續時間的 1/100。

原生模組只能參考記憶體最佳化資料表,且其無法參考磁碟資料表。

有三種類型的原生編譯模組:

Azure SQL Database 中的可用性

記憶體內部 OLTP 和資料行存放區可在 Azure SQL Database 中使用。 如需詳細資訊,請參閱在 SQL Database 中使用記憶體內部技術最佳化效能

1. 確保相容性層級 >= 130

本節是一系列已編製號碼之一節的開始,並且示範您可以用來實作記憶體內部 OLTP 功能的 Transact-SQL 語法。

首先,將您的資料庫設定為至少 130 的相容性層級很重要。 接下來是使用 T-SQL 程式碼來檢視您目前的資料庫所設定的相容性層級。

SELECT d.compatibility_level
    FROM sys.databases as d
    WHERE d.name = Db_Name();

然後是使用 T-SQL 程式碼來更新層級 (如有必要)。

ALTER DATABASE CURRENT
    SET COMPATIBILITY_LEVEL = 130;

2.提升至 SNAPSHOT

當交易涉及磁碟資料表和記憶體最佳化資料表時,我們稱之為跨容器交易。 在這樣的交易中,很重要的一點是交易的記憶體最佳化部分需在名為 SNAPSHOT 的交易隔離等級中執行。

若要在跨容器交易中針對記憶體最佳化資料表可靠地強制執行此等級,請透過執行以下 T-SQL 來修改您的資料庫設定

ALTER DATABASE CURRENT
    SET MEMORY_OPTIMIZED_ELEVATE_TO_SNAPSHOT = ON;

3.建立最佳化的 FILEGROUP

在 Microsoft SQL Server 中,在您能夠建立記憶體最佳化資料表之前,您必須先建立宣告 CONTAINS MEMORY_OPTIMIZED_DATA 的 FILEGROUP。 FILEGROUP 會指派給您的資料庫。 如需詳細資料,請參閱:

在 Azure SQL Database 中,您不需要也無法建立這樣的 FILEGROUP。

下列 T-SQL 指令碼範例會針對記憶體內部 OLTP 啟用資料庫,並設定所有建議的設定。 它會同時使用 SQL Server 和 Azure SQL Database:enable-in-memory-oltp.sql

即使資料庫具有 MEMORY_OPTIMIZED_DATA 檔案群組,也不一定支援所有 SQL Server 功能。 如需有關限制的詳細資料,請參閱:記憶體內部 OLTP 不支援的 SQL Server 功能

4.建立記憶體最佳化資料表

重要的 Transact-SQL 關鍵字是 MEMORY_OPTIMIZED。

CREATE TABLE dbo.SalesOrder
    (
        SalesOrderId   integer   not null   IDENTITY
            PRIMARY KEY NONCLUSTERED,
        CustomerId   integer    not null,
        OrderDate    datetime   not null
    )
        WITH
            (MEMORY_OPTIMIZED = ON,
            DURABILITY = SCHEMA_AND_DATA);

針對記憶體最佳化資料表的 Transact-SQL INSERT 和 SELECT 陳述式與一般資料表無異。

適用於記憶體最佳化資料表的 ALTER TABLE

ALTER TABLE...ADD/DROP 可以從記憶體最佳化資料表或索引新增或移除資料行。

  • CREATE INDEX 和 DROP INDEX 無法針對記憶體最佳化資料表執行,請改用 ALTER TABLE ...ADD/DROP INDEX。
  • 如需詳細資料,請參閱 修改記憶體最佳化資料表

規劃您的記憶體最佳化資料表及索引

5.建立原生編譯的預存程序 (原生程序)

重要關鍵字為 NATIVE_COMPILATION。

CREATE PROCEDURE ncspRetrieveLatestSalesOrderIdForCustomerId  
        @_CustomerId   INT  
        WITH  
            NATIVE_COMPILATION,  
            SCHEMABINDING  
    AS  
    BEGIN ATOMIC  
        WITH  
            (TRANSACTION ISOLATION LEVEL = SNAPSHOT,
            LANGUAGE = N'us_english')  
      
        DECLARE @SalesOrderId int, @OrderDate datetime;
      
        SELECT TOP 1  
                @SalesOrderId = s.SalesOrderId,  
                @OrderDate    = s.OrderDate  
            FROM dbo.SalesOrder AS s  
            WHERE s.CustomerId = @_CustomerId  
            ORDER BY s.OrderDate DESC;  
      
        RETURN @SalesOrderId;  
    END;  

關鍵字 SCHEMABINDING 表示原生程序中參考的資料表無法卸除,除非先卸除原生程序。 如需詳細資料,請參閱建立原生編譯的預存程序

請注意,您並不需要為了存取記憶體最佳化資料表,而建立原生編譯的預存程序。 您也可以透過傳統預存程序和隨選批次,來參考記憶體最佳化資料表。

6.執行原生程序

填入包含兩個資料列的資料表。

INSERT into dbo.SalesOrder  
        ( CustomerId, OrderDate )  
    VALUES  
        ( 42, '2013-01-13 03:35:59' ),
        ( 42, '2015-01-15 15:35:59' );

接著會對原生編譯的預存程序進行 EXECUTE 呼叫。

DECLARE @LatestSalesOrderId int, @mesg nvarchar(128);
      
EXECUTE @LatestSalesOrderId =  
    ncspRetrieveLatestSalesOrderIdForCustomerId 42;
      
SET @mesg = CONCAT(@LatestSalesOrderId,  
    ' = Latest SalesOrderId, for CustomerId = ', 42);
PRINT @mesg;  

以下是實際的 PRINT 輸出:

-- 2 = Latest SalesOrderId, for CustomerId = 42  

文件與後續步驟的指南

上述一般範例可提供基礎知識,以協助您了解記憶體內部 OLTP 的更進階功能。 下列小節為您可能需要知道之特殊考量,以及您可以移至何處以查看每項特殊考量之相關詳細資料的指南。

記憶體內部 OLTP 功能如何運作得這麼快

下列子小節會概略描述記憶體內部 OLTP 功能如何在內部運作以提供改進效能。

記憶體最佳化資料表如何執行得更快

雙重本質: 記憶體最佳化資料表具有雙重本質:一個是在作用中記憶體中的表示方式,另一個是在硬碟上的表示方式。 每項交易都會對資料表的兩種代表方式進行認可。 交易會針對速度較快的使用中記憶體表示方式運作。 記憶體最佳化資料表可從速度更快的使用中記憶體 (相較於硬碟) 獲益。 此外,使用中記憶體較高的敏捷性也讓針對速度最佳化的更先進資料表結構得以實現。 進階結構也是無頁面結構,因此它可以避免閂鎖和執行序同步鎖定超出負荷及競爭。

無鎖定: 記憶體最佳化資料表依賴「開放式」方法來達成資料完整性與並行處理及高輸送量之間的競爭目標。 在交易期間,資料表不會鎖定任何版本的已更新資料列。 這可以顯著降低某些高容量系統中的競爭。

資料列版本: 記憶體最佳化資料表會在資料表本身 (而非在 tempdb) 中新增已更新之資料列的新版本,而不使用鎖定。 原始資料列會保留到交易被認可之後。 在交易期間,其他處理序可以讀取資料表的原始版本。

  • 為磁碟資料表建立多個版本的資料列時,資料列版本會暫時儲存在 tempdb 中。

記錄較少: 資料列的更新前和更新後版本會保留在記憶體最佳化資料表中。 資料列配對可提供許多傳統上會寫入記錄檔的資訊。 這可以讓系統寫入較少的資訊,以及降低寫入記錄的頻率。 同時還能確保交易完整性。

原生程序如何執行得更快

將一般轉譯的預存程序轉換成原生編譯的預存程序,能夠大幅減少執行階段期間執行的指令數目。

記憶體內部功能的取捨

如同電腦科學中常見的取捨考量一樣,記憶體內部功能所提供的效能提升就是一項取捨考量。 更好的功能所帶來的好處,其價值高於為功能所付出的額外成本。 您可以找到有關取捨的完整指導︰

本節的其餘部分會列出一些主要的規劃和取捨考量。

memory_optimized 資料表的取捨

估計記憶體: 您必須估計記憶體最佳化資料表將取用的作用中記憶體數量。 您的電腦系統必須擁有足夠的記憶體容量,才能裝載記憶體最佳化資料表。 如需詳細資料,請參閱:

分割大型資料表: 滿足眾多作用中記憶體需求的方式之一,是將您的大型資料表分割成多個部分,部分位於記憶體內部,用來儲存「經常存取的最近使用」資料列,其他部分則位於磁碟上,用來儲存「不常存取的舊版」資料列 (例如已經完全出貨並結單的銷售訂單)。 此資料分割的設計與實作程序為手動程序。 請參閱:

原生程序的取捨

  • 原生編譯的預存程序無法存取磁碟資料表。 原生程序只能存取記憶體最佳化資料表。
  • 當原生程序在伺服器或資料庫最近恢復上線之後第一次執行時,必須將原生程序重新編譯一次。 這會造成在原生程序開始執行之前出現延遲。

記憶體最佳化資料表的進階考量

記憶體最佳化資料表的索引 有些部分與傳統磁碟之資料表上的索引不同。 只有在記憶體最佳化資料表上才能使用雜湊索引。

您必須加以規劃,以確保有足夠的使用中記憶體可供您規劃的記憶體最佳化資料表和其索引使用。 請參閱:

記憶體最佳化資料表可以使用 DURABILITY = SCHEMA_ONLY 進行宣告:

  • 此語法可在資料庫離線時,告知系統捨棄來自記憶體最佳化資料表的所有資料。 只會保存資料表定義。
  • 當資料庫恢復上線時,記憶體最佳化資料表會載入回使用中記憶體,但其中不包含任何資料。
  • 包含數千個資料列時,SCHEMA_ONLY 資料表可以是 tempdb 中 #temporary 資料表 的較佳替代項目。

資料表變數也可以宣告為記憶體最佳化。 請參閱:

原生編譯模組的進階考量

可透過 Transact-SQL 使用的原生編譯模組類型為:

原生編譯使用者定義函數 (UDF) 的執行速度比解譯的 UDF 還要快。 以下是使用 UDF 時所需考慮的數個事項:

  • 當 T-SQL SELECT 使用 UDF 時,一律會在每個傳回資料列上呼叫一次 UDF。
    • UDF 永遠不會以內嵌方式執行,而是一律以呼叫的方式執行。
    • 相較於所有 UDF 固有之重複呼叫的額外負荷,編譯的差異並沒有那麼重要。
    • 而且,在實際層級,通常可接受 UDF 呼叫的額外負荷。

如需原生 UDF 效能的測試資料和說明,請參閱︰

記憶體最佳化資料表的文件指南

請參閱下列其他討論記憶體最佳化資料表特殊考量的文章:

原生程序的文件指南

下文及其在目錄 (TOC) 中的分支文件,會詳細說明原生編譯的預存程序。

下列文章提供程式碼,示範您可以使用記憶體內部 OLTP 達到的效能提升︰