Teilen über


Indizieren von JSON-Daten

Gilt für: SQL Server 2016 (13.x) und höher Azure SQL-Datenbank Azure SQL Managed Instance

Sie können jedoch Ihre Abfragen über JSON-Dokumente optimieren, indem Sie Standardindizes verwenden. SQL Server bietet keine benutzerdefinierten JSON-Indizes.

Indizes funktionieren auf die gleiche Weise auf JSON-Daten in varchar/nvarchar oder dem nativen json-Datentyp.

Datenbankindizes verbessern die Leistung von Filter- und Sortierungsvorgängen. Ohne Indizes muss SQL Server bei jeder Datenabfrage einen vollständigen Tabellenscan durchführen.

Indizieren von JSON-Eigenschaften mithilfe von berechneten Spalten

Wenn Sie JSON-Daten in SQL Server speichern, möchten Sie normalerweise die Abfrageergebnisse nach mindestens einer Eigenschaft der JSON-Dokumente filtern oder sortieren.

Beispiel

In diesem Beispiel wird angenommen, dass die AdventureWorks.SalesOrderHeader-Tabelle über eine Info-Spalte verfügt, die verschiedene Informationen im JSON-Format zu Verkaufsaufträgen enthält. Sie enthält beispielsweise unstrukturierte Daten zu Kunde, Vertriebsmitarbeiter, Versand- und Rechnungsadresse usw. Sie können Werte aus der Info-Spalte verwenden, um Verkaufsaufträge eines Kunden zu filtern.

Standardmäßig ist die verwendete Spalte Info nicht vorhanden. Sie kann mit dem folgenden Code in der AdventureWorks-Datenbank erstellt werden. Die folgenden Beispiele gelten nicht für die AdventureWorksLT-Reihe von Beispieldatenbanken.

IF NOT EXISTS(SELECT * FROM sys.columns WHERE object_id = OBJECT_ID('[Sales].[SalesOrderHeader]') AND name = 'Info')
    ALTER TABLE [Sales].[SalesOrderHeader] ADD [Info] NVARCHAR(MAX) NULL
GO
UPDATE h 
SET [Info] =
(
    SELECT [Customer.Name]  = concat(p.FirstName, N' ', p.LastName), 
           [Customer.ID]    = p.BusinessEntityID, 
           [Customer.Type]  = p.[PersonType], 
           [Order.ID]       = soh.SalesOrderID, 
           [Order.Number]   = soh.SalesOrderNumber, 
           [Order.CreationData] = soh.OrderDate, 
           [Order.TotalDue] = soh.TotalDue
    FROM [Sales].SalesOrderHeader AS soh
         INNER JOIN [Sales].[Customer] AS c ON c.CustomerID = soh.CustomerID
         INNER JOIN [Person].[Person] AS p ON p.BusinessEntityID = c.CustomerID
    WHERE soh.SalesOrderID = h.SalesOrderID FOR JSON PATH, WITHOUT_ARRAY_WRAPPER 
)
FROM [Sales].SalesOrderHeader AS h; 

Zu optimierende Abfrage

Hier finden Sie ein Beispiel der Art von Abfrage, die Sie optimieren möchten, indem Sie einen Index verwenden.

SELECT SalesOrderNumber,
    OrderDate,
    JSON_VALUE(Info, '$.Customer.Name') AS CustomerName
FROM Sales.SalesOrderHeader
WHERE JSON_VALUE(Info, '$.Customer.Name') = N'Aaron Campbell' 

Beispielindex

Falls Sie Ihre Filter oder die ORDER BY-Klausel in Bezug auf eine Eigenschaft in einem JSON-Dokument beschleunigen möchten, können Sie die gleichen Indizes verwenden, die Sie bereits bei Ihren anderen Spalten verwenden. Sie können in JSON-Dokumenten jedoch nicht direkt auf Eigenschaften verweisen.

  1. Erstellen Sie zunächst eine „virtuelle Spalte“, die die Werte zurückgibt, die Sie für die Filterung verwenden möchten.
  2. Erstellen Sie anschließend einen Index auf dieser virtuellen Spalte.

Im folgenden Beispiel wird eine berechnete Spalte erstellt, die für die Indizierung verwendet werden kann. Anschließend wird ein Index für die neue berechnete Spalte erstellt. In diesem Beispiel wird eine Spalte erstellt, die den Namen des Kunden verfügbar macht, der im Pfad $.Customer.Name in den JSON-Daten gespeichert ist.

ALTER TABLE Sales.SalesOrderHeader
ADD vCustomerName AS JSON_VALUE(Info,'$.Customer.Name')

CREATE INDEX idx_soh_json_CustomerName
ON Sales.SalesOrderHeader(vCustomerName)  

Diese Anweisung gibt die folgende Warnung zurück:

Warning! The maximum key length for a nonclustered index is 1700 bytes.
The index 'vCustomerName' has maximum length of 8000 bytes.
For some combination of large values, the insert/update operation will fail.

Die Funktion JSON_VALUE kann Textwerte bis zu 8.000 Byte zurückgeben (z. B. als Typ NVARCHAR(4000)). Werte, die größer als 1.700 Bytes sind, können jedoch nicht indiziert werden. Wenn Sie versuchen, in der indizierten berechneten Spalte einen Wert mit mehr als 1.700 Bytes einzugeben, tritt beim Vorgang in der Datenbearbeitungssprache (Data Manipulation Language, DML) ein Fehler auf.

Versuchen Sie zur Erzielung einer besseren Leistung, den Wert, den Sie mithilfe der berechneten Spalte verfügbar gemacht haben, in den kleinsten anwendbaren Datentyp umzuwandeln. Verwenden Sie dazu die Typen int und datetime2 anstelle von Zeichenfolgentypen.

Weitere Informationen über die berechnete Spalte

Berechnete Spalten werden nicht persistiert. Berechnete Spalten werden nur berechnet, wenn der Index erneut erstellt werden muss. Sie beansprucht keinen zusätzlichen Platz in der Tabelle.

Es ist wichtig, die berechnete Spalte mit dem gleichen Ausdruck zu erstellen, den Sie in Ihren Abfragen verwenden möchten – in diesem Beispiel handelt es sich dabei um den Ausdruck JSON_VALUE(Info, '$.Customer.Name').

Sie müssen Ihre Abfragen nicht neu schreiben. Falls Sie wie in der vorherigen Beispielabfrage dargestellt Ausdrücke mit der JSON_VALUE-Funktion verwenden, erkennt SQL Server, dass es eine gleichwertig berechnete Spalte mit dem gleichen Ausdruck gibt und wendet dann, falls möglich, einen Index darauf an.

Ausführungsplan für dieses Beispiel

Hier finden Sie den Ausführungsplan für die Abfrage in diesem Beispiel.

Screenshot: Ausführungsplan für dieses Beispiel

Statt eines vollständigen Tabellenscans verwendet SQL Server eine Indexsuche im nicht gruppierten Index, und findet so die Zeilen, die die angegebenen Bedingungen erfüllen. Er verwendet dann eine Schlüsselsuche in der Tabelle SalesOrderHeader, um die anderen Spalten abzurufen, auf die die Abfrage verweist – in diesem Beispiel SalesOrderNumber und OrderDate.

Weiteres Optimieren des Index mit enthaltenen Spalten

Diese zusätzliche Suche können Sie umgehen, indem Sie die geforderten Spalten dem Index hinzufügen. Sie können diese Spalten als standardmäßig enthaltene Spalten hinzufügen. Dies wird im folgenden Beispiel dargestellt, das eine Erweiterung des vorherigen CREATE INDEX-Beispiels darstellt.

CREATE INDEX idx_soh_json_CustomerName
ON Sales.SalesOrderHeader(vCustomerName)
INCLUDE(SalesOrderNumber,OrderDate)

In diesem Fall liest SQL Server keine zusätzlichen Daten von der Tabelle SalesOrderHeader, da alle benötigten Informationen im nicht gruppierten JSON-Index enthalten sind. Dieser Index ist eine gute Möglichkeit, um JSON- und Spaltendaten in Abfragen zu kombinieren und optimale Indizes für Ihre Arbeitsauslastung zu erstellen.

JSON-Indizes sind Indizes mit Sortierungserkennung

Eine wichtige Funktion von Indizes für JSON-Daten ist, dass die Indizes über eine Sortierungserkennung verfügen. Das Ergebnis der Funktion JSON_VALUE, die Sie beim Erstellen der berechneten Spalte verwenden, ist ein Textwert, der seine Sortierung vom Eingabeausdruck erbt. Die Werte im Index sind daher nach den Sortierungsregeln geordnet, die in den Quellspalten definiert sind.

Im folgenden Beispiel wird eine einfache Sammlungstabelle mit einem Primärschlüssel und JSON-Inhalten erstellt, um zu demonstrieren, dass die Indizes über eine Sortierungserkennung verfügen.

CREATE TABLE JsonCollection
 (
  id INT IDENTITY CONSTRAINT PK_JSON_ID PRIMARY KEY,
  [json] NVARCHAR(MAX) COLLATE SERBIAN_CYRILLIC_100_CI_AI
  CONSTRAINT [Content should be formatted as JSON]
  CHECK(ISJSON(json)>0)
 ) 

Der vorherige Befehl gibt die serbisch-kyrillische Sortierung für die json-Spalte an. Das folgende Beispiel füllt die Tabelle auf und erstellt einen Index auf die Namenseigenschaft.

INSERT INTO JsonCollection
VALUES
(N'{"name":"Иво","surname":"Андрић"}'),
(N'{"name":"Андрија","surname":"Герић"}'),
(N'{"name":"Владе","surname":"Дивац"}'),
(N'{"name":"Новак","surname":"Ђоковић"}'),
(N'{"name":"Предраг","surname":"Стојаковић"}'),
(N'{"name":"Михајло","surname":"Пупин"}'),
(N'{"name":"Борислав","surname":"Станковић"}'),
(N'{"name":"Владимир","surname":"Грбић"}'),
(N'{"name":"Жарко","surname":"Паспаљ"}'),
(N'{"name":"Дејан","surname":"Бодирога"}'),
(N'{"name":"Ђорђе","surname":"Вајферт"}'),
(N'{"name":"Горан","surname":"Бреговић"}'),
(N'{"name":"Милутин","surname":"Миланковић"}'),
(N'{"name":"Никола","surname":"Тесла"}')
GO
  
ALTER TABLE JsonCollection
ADD vName AS JSON_VALUE(json,'$.name')

CREATE INDEX idx_name
ON JsonCollection(vName)

Die vorherigen Befehle erstellen einen Standardindex auf die berechnete Spalte vName, die den Wert der JSON-Eigenschaft $.name darstellt. In der serbisch-kyrillischen Codepage lautet die Reihenfolge der Buchstaben А, Б, В, Г, Д, Ђ, Е usw. Die Reihenfolge der Elemente im Index entspricht den serbisch-kyrillischen Regeln, da das Ergebnis der JSON_VALUE-Funktion seine Sortierung aus der Quellspalte erbt. Im folgenden Beispiel wird diese Auflistung abgefragt und die Ergebnisse nach Namen sortiert.

SELECT JSON_VALUE(json,'$.name'),*
FROM JsonCollection
ORDER BY JSON_VALUE(json,'$.name')

Wenn Sie sich den tatsächlichen Ausführungsplan ansehen, sehen Sie, dass er die sortierten Werte aus dem nicht gruppierten Index verwendet.

Screenshot: Ausführungsplan mit sortierten Werten aus dem nicht gruppierten Index

Obwohl die Abfrage eine ORDER BY-Klausel hat, verwendet der Ausführungsplan keinen Sort-Operator. Der JSON-Index ist bereits nach den Regeln für serbisches Kyrillisch geordnet. Daher kann SQL Server den nicht gruppierten Index verwenden, in dem die Ergebnisse bereits sortiert wurden.

Falls Sie jedoch die Sortierung des ORDER BY-Ausdrucks ändern, indem Sie beispielsweise COLLATE French_100_CI_AS_SC an die JSON_VALUE-Funktion anhängen, erhalten Sie einen anderen Ausführungsplan für die Abfrage.

Screenshot: anderer Ausführungsplan

Da die Anordnung der Werte im Index nicht mit den französischen Sortierungsregeln übereinstimmt, kann SQL Server den Index nicht verwenden, um Ergebnisse zu ordnen. Daher wird ein Sort-Operator hinzugefügt, der Ergebnisse nach den französischen Sortierungsregeln sortiert.

Microsoft-Videos

Hinweis

Einige der Videolinks in diesem Abschnitt funktionieren derzeit möglicherweise nicht. Microsoft migriert Inhalte, die zuvor auf Channel 9 veröffentlicht wurden, zu einer neuen Plattform. Wir aktualisieren die Links, wenn die Videos zur neuen Plattform migriert werden.

Eine visuelle Einführung in die JSON-Unterstützung, die in SQL Server und Azure SQL-Datenbank integriert ist, finden Sie in den folgenden Videos: