XML インデックス (SQL Server)

適用対象:SQL Server Azure SQL Database Azure SQL Managed Instance Microsoft Fabric の SQL データベース

xml データ型の列には xml インデックスを作成できます。列に保存されている XML インスタンスのすべてのタグ、値、およびパスにインデックスが設定されるので、クエリのパフォーマンスが向上します。次のような場合、XML インデックスの効果が得られる可能性があります。

ワークロードで XML 列へのクエリが頻繁に行われる場合。データ変更時の XML インデックスのメンテナンスコストを考慮する必要があります。
XML 値が比較的大きいのに対し、取得する部分が比較的小さい場合。インデックスを作成すると、実行時にデータ全体が解析されることを回避し、クエリ処理を効率化するためのインデックス参照を利用できます。

SQL Server 2022 (16.x) 以降のバージョン、および Azure SQL Database、Microsoft Fabric の SQL データベース、および Azure SQL Managed Instance では、 XML 圧縮を使用して、XML 列とインデックスの両方の行外の XML データを圧縮できます。 XML 圧縮により、データストレージの容量要件が削減されます。

XML のインデックスは、次のカテゴリに分類されます。

プライマリ XML インデックス
セカンダリ XML インデックス

xml 型の列の最初のインデックスは、プライマリ XML インデックスである必要があります。プライマリ XML インデックスを使用している場合は、PATH、VALUE、および PROPERTY という種類のセカンダリ XML インデックスがサポートされます。クエリの種類によって異なりますが、これらのセカンダリ XML インデックスを使用することで、クエリのパフォーマンス向上に役立つ場合があります。

注

XML インデックスを作成したり変更したりするには、 xml データ型を操作できるようにデータベースオプションが正しく設定されている必要があります。詳細については、「 XML 列でのフルテキスト検索の使用」を参照してください。

XML インスタンスは、BLOB (バイナリラージオブジェクト) として xml 型の列に格納されます。これらの XML インスタンスは大きくなる可能性がありますが、 xml データ型インスタンスをバイナリ表記したものを最大 2 GB まで格納できます。インデックスを設定しない場合、クエリを評価するためにこのようなバイナリラージオブジェクトが実行時に細分化されます。この細分化には時間がかかる場合があります。たとえば、次のクエリを考えてみましょう。

;WITH XMLNAMESPACES ('https://schemas.microsoft.com/sqlserver/2004/07/adventure-works/ProductModelDescription' AS "PD")

SELECT CatalogDescription.query('
  /PD:ProductDescription/PD:Summary
') as Result
FROM Production.ProductModel
WHERE CatalogDescription.exist ('/PD:ProductDescription/@ProductModelID[.="19"]') = 1;

WHERE 句の条件を満たす XML インスタンスを選択するために、テーブル Production.ProductModel の各行内の XML BLOB (バイナリラージオブジェクト) が実行時に細分化されます。次に、 (/PD:ProductDescription/@ProductModelID[.="19"]メソッドの式 exist() ) が評価されます。このような実行時の細分化は、列に格納されたインスタンスのサイズや数によってはコストが高くなる場合があります。

使用しているアプリケーション環境で、XML BLOB (バイナリラージオブジェクト) に対するクエリを頻繁に実行する場合は、 xml 型の列のインデックスを設定することが役に立ちます。ただし、データの変更時には、インデックスのメンテナンスに関するコストがかかります。

プライマリ XML インデックス

プライマリ XML インデックスにより、XML 列に保存されている XML インスタンスのすべてのタグ、値、およびパスにインデックスが設定されます。プライマリ XML インデックスを作成するには、XML 列があるテーブルの主キーにクラスター化インデックスが作成されている必要があります。 SQL Serverはこの主キーを使用して、プライマリ XML インデックスの行を、XML 列を含むテーブルの行に関連付けます。

プライマリ XML インデックスは、 xml データ型列内の XML BLOB の細分化された永続化表現です。インデックスでは、列内の XML BLOB (バイナリラージオブジェクト) ごとに、数行のデータ行が作成されます。インデックス内の行数は、XML バイナリラージオブジェクトのノード数とほぼ等しくなります。クエリで完全な XML インスタンスを取得する場合は、SQL Server によって XML 列からインスタンスが返されます。 XML インスタンス内でクエリを実行するときはプライマリ XML インデックスが使用され、インデックス自体によってスカラー値または XML サブツリーが返すことができます。

各行には、次のノード情報が格納されます。

要素名、属性名などのタグ名。
ノード値。
要素ノード、属性ノード、テキストノードなどのノードの型。
ドキュメント内の表示順情報。内部ノード識別子によって表現されます。
各ノードから XML ツリーのルートまでのパス。クエリ内のパス式ではこの列を検索します。
ベーステーブルの主キー。ベーステーブルとの逆結合のため、ベーステーブルの主キーがプライマリ XML インデックスにコピーされます。ベーステーブルの主キーの最大列数は 15 です。

このノード情報は、指定されたクエリに対して XML の結果を評価し構築するために使用されます。最適化のために、タグ名とノード型の情報は整数値でエンコードされるので、パス列でも同じエンコードを使用します。また、パスのサフィックスが既知の場合にのみパスを照合できるように、パスは逆の順序で格納されます。次に例を示します。

//ContactRecord/PhoneNumber 最後の 2 つのロケーションステップだけが既知です。

または

/Book/*/Title ここで、ワイルドカード文字 * は式の中間で指定されています。

xml データ型のメソッドに関係するクエリの場合、クエリプロセッサでプライマリ XML インデックスが使用され、スカラー値またはプライマリインデックス自体の XML サブツリーのどちらかが返されます。 (このプライマリ XML インデックスには XML インスタンスの再構築に必要なすべての情報が格納されています)。

たとえば、次のクエリでは、CatalogDescription テーブルの ProductModel 型列に格納されている概要情報が返されます。このクエリでは、カタログの説明に <Summary> の説明も格納されている製品モデルに限り <Features> 情報が返されます。

;WITH XMLNAMESPACES ('https://schemas.microsoft.com/sqlserver/2004/07/adventure-works/ProductModelDescription' AS "PD")

SELECT CatalogDescription.query('  /PD:ProductDescription/PD:Summary') as Result
FROM Production.ProductModel
WHERE CatalogDescription.exist ('/PD:ProductDescription/PD:Features') = 1

プライマリ XML インデックスでは、ベーステーブルの各 XML バイナリラージオブジェクトインスタンスを細分化するのではなく、各 XML バイナリラージオブジェクトに対応するインデックスの行が exist() メソッドで指定された式に対して順番に検索されます。インデックスのパス列にそのパスが見つかると、プライマリ XML インデックスから <Summary> 要素とそのサブツリーが共に取得され、query() メソッドの結果として XML バイナリラージオブジェクトに変換されます。

XML インスタンス全体を取得するときには、プライマリ XML インデックスは使用されません。たとえば、次のクエリでは、特定の製品モデルの製造手順を説明する XML インスタンス全体をテーブルから取得します。

USE AdventureWorks2022;

SELECT Instructions
FROM   Production.ProductModel
WHERE  ProductModelID = 7;

セカンダリ XML インデックス

検索のパフォーマンスを向上するために、セカンダリ XML インデックスを作成できます。セカンダリ XML インデックスを作成する前に、プライマリ XML インデックスが存在している必要があります。セカンダリ XML インデックスの種類を次に示します。

PATH セカンダリ XML インデックス
VALUE セカンダリ XML インデックス
PROPERTY セカンダリ XML インデックス

次に、セカンダリインデックスを 1 種類以上作成する場合のガイドラインを示します。

ワークロードで XML 列にパス式が多用されている場合、PATH セカンダリ XML インデックスを作成するとワークロードを高速に処理できることがあります。一般的な例では、Transact-SQL の WHERE 句で XML 列に対し exist() メソッドが使用される場合があります。
パス式を使用して個々の XML インスタンスから複数の値を取得する場合、PROPERTY インデックスで各 XML インスタンス内のパスをクラスター化すると効果が得られる可能性があります。このシナリオは、主キーの値がわかっていてオブジェクトのプロパティをフェッチするプロパティバッグシナリオで主に発生します。
XML インスタンスの値を、要素名または属性名がわからないままクエリで取得する場合、VALUE インデックスを作成できます。 //author[last-name="Howard"] (<author> 要素が階層のどのレベルにあってもよい) のように、descendant 軸を検索する場合がその典型です。また、ワイルドカードを使用するクエリ (いずれかの属性に値 /book [@* = "novel"] が指定された <book> 要素をクエリで検索する "novel" など) もこれに該当します。

PATH セカンダリ XML インデックス

クエリで xml 型列のパス式をよく指定している場合、PATH セカンダリインデックスにより検索速度を向上できる場合があります。この記事で既に説明したように、WHERE 句に exist() メソッドを指定するクエリを使用する場合には、プライマリインデックスが役に立ちます。 PATH セカンダリインデックスを追加することでも、そのようなクエリの検索パフォーマンスが向上する場合があります。

プライマリ XML インデックスにより、XML バイナリラージオブジェクトを実行時に細分化せずに済むようになりますが、パス式に基づくクエリのパフォーマンスが最適にならない場合があります。 XML バイナリラージオブジェクトに対応するプライマリ XML インデックスのすべての行は大きな XML インスタンスに対して順番に検索されるので、検索速度が低下する場合があります。このような場合、プライマリインデックスのパス値とノード値にセカンダリインデックスを構築すると、インデックス検索の速度を大幅に向上できます。 PATH セカンダリインデックスではパス値とノード値がキー列になり、パスの検索時により効率的にシークできるようになります。クエリオプティマイザーでは、次に示すような式に PATH インデックスを使用できます。

/root/Location パスだけを指定しています。

または

/root/Location/@LocationID[.="10"] パスとノード値の両方を指定しています。

次のクエリでは、PATH インデックスが役立つケースを示します。

;WITH XMLNAMESPACES ('https://schemas.microsoft.com/sqlserver/2004/07/adventure-works/ProductModelDescription' AS "PD")

SELECT CatalogDescription.query('
  /PD:ProductDescription/PD:Summary
') AS Result
FROM Production.ProductModel
WHERE CatalogDescription.exist ('/PD:ProductDescription/@ProductModelID[.="19"]') = 1;

このクエリでは、 /PD:ProductDescription/@ProductModelID メソッド内のパス式 "19" と値 exist() が PATH インデックスのキーフィールドに対応しています。これにより、PATH インデックス内を直接シークできるようになり、プライマリ XML インデックスでパス値を順番に検索するよりも検索のパフォーマンスが向上します。

VALUE セカンダリ XML インデックス

/Root/ProductDescription/@*[. = "Mountain Bike"] や //ProductDescription[@Name = "Mountain Bike"] などのように、クエリが値に基づいており、パスが完全に指定されていない場合や、パスにワイルドカードが含まれている場合は、プライマリ XML インデックスのノード値にセカンダリ XML インデックスを構築すると、より迅速に結果を得られる場合があります。

VALUE インデックスのキー列は、プライマリ XML インデックスの列 (ノード値とパス) です。値を格納している要素名または属性名がわからない状態で XML インスタンスの値に対するクエリを実行する作業がワークロードに含まれている場合、VALUE インデックスが役立つことがあります。たとえば、次の式は VALUE インデックスを使用すると効率的になります。

//author[LastName="someName"] ここで、<LastName> 要素の値はわかっていますが、親である <author> はどこにでも存在し得ます。
/book[@* = "someValue"] ここで、クエリにより <book> という値の属性を持つ "someValue" 要素を検索します。

次のクエリは、 ContactID テーブルから Contact を返します。 WHERE 句では、AdditionalContactInfoxml 型列の値を検索するフィルターが指定されています。連絡先 ID は、対応する追加の連絡先情報の XML バイナリラージオブジェクトに特定の電話番号が含まれている場合にのみ返されます。 telephoneNumber 要素は XML 内のどこにでも存在し得るので、パス式で descendent-or-self 軸を指定しています。

;WITH XMLNAMESPACES (
  'https://schemas.microsoft.com/sqlserver/2004/07/adventure-works/ContactInfo' AS CI,
  'https://schemas.microsoft.com/sqlserver/2004/07/adventure-works/ContactTypes' AS ACT
)

SELECT ContactID
FROM Person.Contact
WHERE AdditionalContactInfo.exist('//ACT:telephoneNumber/ACT:number[.="111-111-1111"]') = 1;

この場合、検索する <number> の値はわかっていますが、この値は telephoneNumber 要素の子として XML インスタンス内のどこにでも存在できます。このようなクエリでは特定の値に基づいてインデックス参照を行うと、効率的になる場合があります。

PROPERTY セカンダリインデックス

個々の XML インスタンスから 1 つ以上の値を取得するクエリでは、PROPERTY インデックスを使用するとメリットが得られる場合があります。 value() 型のメソッドを使用してオブジェクトのプロパティを取得する場合や、オブジェクトの主キー値が既知である場合にこのような状況が発生します。

PROPERTY インデックスは、プライマリ XML インデックスの列 (PK、パス、およびノード値) について構築されます。PK はベーステーブルの主キーです。

たとえば、次のクエリでは、製品モデル 19の ProductModelID 属性と ProductModelName 属性の値を value() メソッドを使用して取得しています。プライマリ XML インデックスや他のセカンダリ XML インデックスではなく PROPERTY インデックスを使用すると、クエリをより迅速に実行できる場合があります。

;WITH XMLNAMESPACES ('https://schemas.microsoft.com/sqlserver/2004/07/adventure-works/ProductModelDescription' AS "PD")

SELECT CatalogDescription.value('(/PD:ProductDescription/@ProductModelID)[1]', 'int') AS ModelID,
  CatalogDescription.value('(/PD:ProductDescription/@ProductModelName)[1]', 'varchar(30)') AS ModelName
FROM Production.ProductModel
WHERE ProductModelID = 19;

この記事で後述する相違点を除き、 XML 型列に XML インデックスを作成することは、XML 以外の型の列にインデックスを作成するのと似ています。 XML インデックスの作成と管理には、次の Transact-SQL DDL ステートメントを使用できます。

XML 圧縮

適用対象: SQL Server 2022 (16.x) 以降のバージョン、および Azure SQL Database、Microsoft Fabric の SQL データベース、および Azure SQL Managed Instance。

XML 圧縮を有効にすると、XML データ型に関連付けられているデータの物理ストレージ形式は "圧縮バイナリ形式" に変更されますが、XML データの構文やセマンティクスは変更されません。 1 つ以上のテーブルで XML 圧縮を有効にしても、アプリケーションの変更は必要ありません。

XML データ型のみが XML 圧縮の影響を受けます。 XML データは、Xpress 圧縮アルゴリズムを使用して圧縮されます。既存の XML インデックスは、データ圧縮を使用して圧縮されます。 XML 圧縮が有効な場合、XML インデックスに対して内部的にデータ圧縮が有効になります。

XML 圧縮は、同じテーブルでデータ圧縮と並行して有効にすることができます。

XML インデックスは、テーブルの圧縮プロパティを継承しません。インデックスを圧縮するには、XML インデックスに対して XML 圧縮を明示的に有効にする必要があります。

セカンダリ XML インデックスは、プライマリ XML インデックスの圧縮プロパティを継承しません。

既定では、XML インデックスの XML 圧縮設定はインデックスの作成時に OFF に設定されます。

XML インデックスに関する情報の取得

XML インデックスエントリは、sys.indexes のインデックスが type のカタログビュー 3 に表示されます。 name 列には XML インデックスの名前が格納されています。

XML インデックスはカタログビュー sys.xml_indexes にも記録されます。これには、sys.indexes のすべての列および XML インデックスに有用な特定の列が含まれています。列 NULL に値 secondary_type がある場合はプライマリ XML インデックスであることを示します。値 P、R、および V はそれぞれ、PATH、PROPERTY、および VALUE セカンダリ XML インデックスを表します。

XML インデックスによる領域の使用状況は、テーブル値関数 sys.dm_db_index_physical_statsでわかります。これは、すべてのインデックスの種類について、占有しているデータページの数、バイト単位の平均行サイズ、レコードの数などの情報を指定します。また、この情報には XML インデックスも含まれています。この情報はデータベースパーティションごとに取得できます。どの XML インデックスにも同一の、ベーステーブルのパーティション構成とパーティション関数が使用されます。

次のステップ

フィードバック

このページはお役に立ちましたか?

Last updated on 2025-01-02