Tabellen- und Zeilengröße in speicheroptimierten Tabellen

Artikel
04/26/2023

Gilt für:SQL Server Azure SQL-Datenbank Azure SQL Managed Instance

Vor SQL Server 2016 (13.x) konnte die Datengröße einer speicheroptimierten Tabelle nicht länger als 8.060 Byte sein. Ab SQL Server 2016 (13.x) und in der Azure SQL-Datenbank ist es nun möglich, eine speicheroptimierte Tabelle mit mehreren großen Spalten (z. B. mehreren Varbinary(8000)-Spalten) und BRANCHENspalten (z. B. varbinary(max), varchar(max) und nvarchar(max)) zu erstellen und Vorgänge mit systemeigenen kompilierten T-SQL-Modulen und Tabellentypen auszuführen.

Spalten, die nicht in das Zeilenlimit von 8060 Bytes passen, werden außerhalb der Zeile in einer separaten internen Tabelle platziert. Jede Spalte außerhalb einer Zeile verfügt über eine entsprechende interne Tabelle, die wiederum über einen einzelnen, nicht gruppierten Index verfügt. Ausführliche Informationen zu diesen internen Tabellen, die für Spalten außerhalb der Zeile verwendet werden, finden Sie unter sys.memory_optimized_tables_internal_attributes (Transact-SQL).For details about these internal tables used for off-row columns see sys.memory_optimized_tables_internal_attributes (Transact-SQL).

Es gibt bestimmte Szenarios, in denen es nützlich ist, die Größe der Zeile und der Tabelle zu berechnen.

Wie viel Arbeitsspeicher verwendet eine Tabelle?
- Der Arbeitsspeicher, der für die Tabelle verwendet wird, kann nicht genau berechnet werden. Viele Faktoren beeinflussen den verwendeten Arbeitsspeicher. Faktoren wie seitenbasierte Speicherbelegung, Ort, Caching und Auffüllung. Darüber hinaus mehrere Versionen von Zeilen, denen entweder aktive Transaktionen zugeordnet sind oder die auf die Garbage Collection warten.
- Die minimale Größe, die für die Daten und Indizes in der Tabelle erforderlich ist, wird durch die Berechnung von [table size] angegeben, wie unten erläutert.
- Da die Berechnung der Arbeitsspeicherverwendung bestenfalls eine Näherung darstellt, ist es ratsam, auch eine Kapazitätsplanung in den Bereitstellungsplänen vorzusehen.
Die Datengröße einer Zeile und die Frage, ob die maximale Zeilengröße von 8.060 Bytes eingehalten wird. Um diese Fragen zu beantworten, verwenden Sie die Berechnung von [row body size], wie unten erläutert.

Eine speicheroptimierte Tabelle besteht aus einer Auflistung von Zeilen und Indizes, die Zeiger auf die Zeilen enthalten. Die folgende Abbildung zeigt eine Tabelle mit Indizes und Zeilen, die wiederum Zeilenüberschriften und Text enthalten:

Memory optimized table.
Speicheroptimierte Tabelle, bestehend aus Indizes und Zeilen.

Tabellengröße berechnen

Die Größe einer Tabelle im Arbeitsspeicher in Bytes wird wie folgt berechnet:

[table size] = [size of index 1] + ... + [size of index n] + ([row size] * [row count])

Die Größe eines Hashindexes wird bei Erstellung der Tabelle festgelegt und hängt von der tatsächlichen Bucketanzahl ab. Der bucket_count, der mit der Indexdefinition angegeben wird, wird auf die nächste Zweierpotenz aufgerundet, um die tatsächliche Bucketanzahl zu erhalten. Wenn der angegebene bucket_count-Wert beispielsweise 100.000 ist, beträgt die tatsächliche Bucketanzahl für den Index 131.072.

[hash index size] = 8 * [actual bucket count]

Die Größe eines nicht gruppierten Index bewegt sich in der Größenordnung von [row count] * [index key size].

Die Zeilengröße wird berechnet, indem die Überschrift und der Text addiert werden:

[row size] = [row header size] + [actual row body size]  
[row header size] = 24 + 8 * [number of indexes]

Berechnen der Zeilenkörpergröße

Zeilenstruktur: Die Zeilen in einer speicheroptimierten Tabelle verfügen über folgende Komponenten:

Die Zeilenüberschrift enthält den Zeitstempel, der erforderlich ist, um Zeilenversionsverwaltung zu implementieren. Die Zeilenüberschrift enthält auch den Indexzeiger, um die Zeilenverkettung in den Hashbuckets zu implementieren (oben beschrieben).
Der Zeilentext enthält die tatsächlichen Spaltendaten, darunter einige zusätzliche Informationen wie das NULL-Array für Spalten, die NULL-Werte zulassen, und das Offsetarray für Datentypen variabler Länge.

Die folgende Abbildung veranschaulicht die Zeilenstruktur für eine Tabelle mit zwei Indizes:

Row structure for a table that has two indexes.

Die Zeitstempel für Beginn und Ende geben den Zeitraum an, in dem eine bestimmte Zeilenversion gültig ist. Für Transaktionen, die in diesem Intervall beginnen, ist diese Zeilenversion sichtbar. Weitere Informationen finden Sie unter Transaktionen mit speicheroptimierten Tabellen.

Die Indexzeiger zeigen auf die nächste Zeile in der Kette, die dem Hashbucket angehört. Die folgende Abbildung veranschaulicht die Struktur einer Tabelle mit zwei Spalten (Name, Ort) und mit zwei Indizes: einem für den Spaltennamen und einen für den Spaltenort.

Structure of a table with two columns and indexes.

In dieser Abbildung werden die Namen John und Jane zum ersten Hashbucket hinzugefügt. Susan wird dem zweiten Hashbucket hinzugefügt. Die Städte Beijing (Peking) und Bogota werden dem ersten Hashbucket hinzugefügt. Paris und Prag werden dem zweiten Hashbucket hinzugefügt.

Somit ergeben sie folgende Ketten für den Hashindex für Namen:

Erster Bucket: (John, Beijing (Peking)); (John, Paris); (Jane, Prag)
Zweiter Bucket: (Susan, Bogota)

Die Ketten für den Index für die Stadt lauten wie folgt:

Erster Bucket: (John, Beijing (Peking)), (Susan, Bogota)
Zweiter Bucket: (John, Paris), (Jane, Prag)

Ein ∞-Endzeitstempel (unendlich) bedeutet, dass es sich um die derzeit gültige Version der Zeile handelt. Die Zeile wurde nicht aktualisiert oder gelöscht, seitdem diese Zeilenversion geschrieben wurde.

Eine Zeit, die größer als 200 ist, enthält die Tabelle die folgenden Zeilen:

Name	City
John	Beijing (Peking)
Jane	Prag

Allerdings wird jeder aktiven Transaktion mit Anfangszeit 100 die folgende Version der Tabelle angezeigt:

Name	City
John	Paris
Jane	Prag
Susan	Bogota

Die Berechnung von [row body size] wird in der folgenden Tabelle erläutert.

Es gibt zwei verschiedene Berechnungen für die Zeilentextgröße: die berechnete Größe und die tatsächliche Größe:

Die berechnete Größe, bezeichnet mit computed row body size, wird verwendet, um festzustellen, ob die Zeilengrößeneinschränkung von 8.060 Bytes überschritten wird.
Die tatsächliche Größe, bezeichnet mit actual row body size, ist die tatsächliche Speichergröße des Zeilentexts im Arbeitsspeicher und in den Prüfpunktdateien.

computed row body size und actual row body size werden ähnlich berechnet. Der einzige Unterschied ist die Berechnung der Größe von (n)varchar(i)- und varbinary(i)-Spalten, wie unten in der folgenden Tabelle dargestellt. Bei der berechneten Zeilentextgröße wird die deklarierte Größe i als Größe der Spalte verwendet, während für die tatsächliche Zeilentextgröße die tatsächliche Größe der Daten verwendet wird.

In der folgenden Tabelle wird die Berechnung der Zeilentextgröße beschrieben, die wie folgt angegeben wird: actual row body size = SUM(size of shallow types) + 2 + 2 * number of deep type columns.

Abschnitt	Size	Bemerkungen
Spalten flacher Typen	SUM([Größe flacher Typen]) Die Größe (in Bytes) der einzelnen Typen lautet wie folgt: Bit: 1 Tinyint: 1 Smallint: 2 Int: 4 Real: 4 Smalldatetime: 4 Smallmoney: 4 Bigint: 8 Datetime: 8 Datetime2: 8 Float: 8 Money: 8 Numerisch (Genauigkeit <=18): 8 Time: 8 Numerisch(Genauigkeit>18): 16 Uniqueidentifier: 16
Auffüllung flacher Spalten	Dabei sind folgende Werte möglich: 1, wenn Spalten tiefer Typen vorhanden sind und die gesamte Datengröße der flachen Spalten eine ungerade Zahl darstellt. 0 andernfalls	Tiefe Typen sind die Typen (var)binary und (n)(var)char.
Offsetarray für Spalten tiefer Typen	Dabei sind folgende Werte möglich: 0, wenn keine Spalten tiefer Typen vorhanden sind 2 + 2 * [number of deep type columns] andernfalls	Tiefe Typen sind die Typen (var)binary und (n)(var)char.
NULL-Array	[number of nullable columns] / 8, aufgerundet auf vollständige Bytes.	Das Array verfügt über ein Bit pro Spalte, die NULL zulässt. Dies wird auf vollständige Bytes aufgerundet.
NULL-Arrayauffüllung	Dabei sind folgende Werte möglich: 1, wenn Spalten tiefer Typen vorhanden sind und die Größe des NULL-Arrays eine ungerade Anzahl von Bytes darstellt. 0 andernfalls	Tiefe Typen sind die Typen (var)binary und (n)(var)char.
Auffüllung	Wenn keine Spalten tiefer Typen vorhanden sind: 0 Wenn Spalten tiefer Typen vorhanden sind, wird eine 0-7-Byte-Auffüllung hinzugefügt, basierend auf der größten Ausrichtung, die für eine flache Spalte erforderlich ist. Jede flache Spalte erfordert eine Ausrichtung gleich ihrer Größe, wie oben beschrieben. Nur GUID-Spalten erfordern eine Ausrichtung von einem Byte (nicht 16) und numerische Spalten immer eine Ausrichtung von 8 Bytes (nie 16). Die größte Ausrichtungsanforderung unter allen flachen Spalten wird verwendet, und eine 0-7-Byte-Auffüllung wird so hinzugefügt, dass die bisherige Gesamtgröße (ohne die Spalten tiefer Typen) ein Vielfaches der erforderlichen Ausrichtung ergibt.	Tiefe Typen sind die Typen (var)binary und (n)(var)char.
Spalten tiefer Typen mit fester Länge	SUM(size of fixed length deep type columns) Die Größe jeder Spalte lautet wie folgt: i für char(i) und binary(i). 2 * i für nchar(i)	Spalten tiefer Typen mit fester Länge sind Spalten des Typs char(i), nchar(i) oder binary(i).
Spalten tiefer Typen mit variabler Länge computed size	SUM(computed size of variable length deep type columns) Die berechnete Größe jeder Spalte lautet wie folgt: i für varchar(i) und varbinary(i) 2 * i für nvarchar(i)	Diese Zeile wird nur auf computed row body size angewendet. Spalten tiefer Typen mit variabler Länge sind Spalten des Typs varchar(i), nvarchar(i) oder varbinary(i). Die berechnete Größe wird durch die maximale Länge (i) der Spalte bestimmt.
Spalten tiefer Typen mit variabler Länge actual size	SUM(actual size of variable length deep type columns) Die tatsächliche Größe jeder Spalte lautet wie folgt: n, wobei n der Anzahl der in der Spalte gespeicherten Zeichen entspricht; für varchar(i). 2 * n, wobei n der Anzahl der in der Spalte gespeicherten Zeichen entspricht; für nvarchar(i). n, wobei n der Anzahl der in der Spalte gespeicherten Bytes ist; für varbinary(i).	Diese Zeile wird nur auf actual row body size angewendet. Die tatsächliche Größe wird durch die Daten bestimmt, die in den Spalten der Zeile gespeichert werden.

Beispiel: Tabellen- und Zeilengrößenberechnung

Für Hashindizes wird die tatsächliche Bucketanzahl auf die nächste Zweierpotenz aufgerundet. Wenn der angegebene bucket_count beispielsweise 100.000 ist, beträgt die tatsächliche Bucketanzahl für den Index 131.072.

Betrachten Sie eine Orders-Tabelle mit folgender Definition:

CREATE TABLE dbo.Orders (  
     OrderID int NOT NULL   
           PRIMARY KEY NONCLUSTERED,  
     CustomerID int NOT NULL   
           INDEX IX_CustomerID HASH WITH (BUCKET_COUNT=10000),  
     OrderDate datetime NOT NULL,  
     OrderDescription nvarchar(1000)  
) WITH (MEMORY_OPTIMIZED=ON)  
GO

Beachten Sie, dass diese Tabelle einen Hashindex und einen nicht gruppierten Index (den Primärschlüssel) aufweist. Darüber hinaus weist sie drei Spalten fester Länge und eine Spalte variabler Länge auf, wobei eine der Spalten NULL-Werte zulässt (OrderDescription). Angenommen, die Tabelle Orders hat 8.379 Zeilen, und die durchschnittliche Länge der Werte in der Spalte OrderDescription ist 78 Zeichen.

Um die Tabellengröße zu ermitteln, ermitteln Sie zuerst die Größe der Indizes. Der bucket_count-Wert für beide Indizes wird mit 10000 angegeben. Dieser wird auf die nächste Zweierpotenz aufgerundet: 16384. Daher ergibt sich die Gesamtgröße der Indizes für die Orders-Tabelle wie folgt:

8 * 16384 = 131072 bytes

Was bleibt, ist die Tabellendatengröße:

[row size] * [row count] = [row size] * 8379

(Die Beispieltabelle enthält 8379 Zeilen.) Jetzt haben wir:

[row size] = [row header size] + [actual row body size]  
[row header size] = 24 + 8 * [number of indices] = 24 + 8 * 1 = 32 bytes

Als Nächstes berechnen wir [actual row body size]:

Spalten flacher Typen:

SUM([size of shallow types]) = 4 [int] + 4 [int] + 8 [datetime] = 16

Die Auffüllung flacher Spalten ist 0, da die Gesamtgröße der flachen Spalten einem geraden Wert entspricht.

Offsetarray für Spalten tiefer Typen:

2 + 2 * [number of deep type columns] = 2 + 2 * 1 = 4

NULL-Array = 1
NULL-Arrayauffüllung = 1, da die NULL-Arraygröße ungerade ist und eine Spalte tiefen Typs vorhanden ist.
Auffüllung
- 8 ist die größte Ausrichtungsanforderung.
- Die bisherige Größe ist 16 + 0 + 4 + 1 + 1 = 22.
- Das nächste Vielfache von 8 ist 24.
- Die Gesamtauffüllung beträgt 24 - 22 = 2 Bytes.
Es sind keine Spalten tiefer Typen mit fester Länge vorhanden (Spalten tiefer Typen mit fester Länge: 0.).
Die tatsächliche Größe der Spalte tiefen Typs ist 2 * 78 = 156. Die einzelne Spalte tiefen Typs OrderDescription hat den Typ nvarchar.

[actual row body size] = 24 + 156 = 180 bytes

Um die Berechnung abzuschließen:

[row size] = 32 + 180 = 212 bytes  
[table size] = 8 * 16384 + 212 * 8379 = 131072 + 1776348 = 1907420

Die gesamte Tabellengröße im Arbeitsspeicher entspricht daher ungefähr 2 MB. Dabei wird weder der mögliche Mehraufwand durch die Speicherbelegung noch die Zeilenversionsverwaltung berücksichtigt, die für die Transaktionen benötigt wird, die auf diese Tabelle zugreifen.

Der tatsächliche Arbeitsspeicher, der dieser Tabelle zugeordnet ist und von ihr und den zugehörigen Indizes verwendet wird, kann über die folgende Abfrage abgerufen werden:

select * from sys.dm_db_xtp_table_memory_stats  
where object_id = object_id('dbo.Orders')

Einschränkungen für Spalten außerhalb der Zeile

Bestimmte Beschränkungen und Vorbehalte bei der Verwendung von zeilenüberragenden Spalten in einer speicheroptimierten Tabelle sind unten aufgeführt:

Wenn es einen Columnstore-Index für eine speicheroptimierte Tabelle gibt, müssen alle Spalten in Zeilen passen.
Alle Indexschlüsselspalten müssen innerhalb von Zeilen gespeichert werden. Wenn eine Indexschlüsselspalte nicht innerhalb von Zeilen passt, schlägt das Hinzufügen des Index fehl.
Vorbehalte für das Ändern einer speicheroptimierten Tabelle mit Spalten außerhalb von Zeilen.
Für LOBs spiegelt die Größenbeschränkung diejenige datenbasierter Tabellen wider (maximal 2 GB auf LOB-Werten).
Für eine optimale Leistung wird empfohlen, dass die meisten Spalten in 8.060 Bytes passen.

Weitere Informationen zu einigen dieser Eigenheiten finden Sie im Blogbeitrag Für In-Memory-OLTP in SQL Server 2016 seit CTP3 Neuigkeiten.

Weitere Informationen

Speicheroptimierte Tabellen