セマンティック検索 (SQL Server)

[アーティクル]
06/13/2017

統計セマンティック検索では、統計的に関連するキーフレーズを抽出してインデックスを作成することで、SQL Server データベースに格納されている非構造化ドキュメントに関する深い分析情報を提供します。次に、これらのキーフレーズを使用して、 類似または関連ドキュメントを特定してインデックスを作成することもできます。

3 つの Transact-SQL 行セット関数を使用することにより、これらのセマンティックインデックスに対してクエリを実行して、結果を構造化データとして取得することができます。

セマンティック検索で実行できる操作

セマンティック検索は、SQL Serverの既存のフルテキスト検索機能に基づいていますが、キーワード (keyword)検索を超える新しいシナリオが可能になります。フルテキスト検索ではドキュメントの単語に対してクエリを実行しますが、セマンティック検索ではドキュメントの意味に対してクエリを実行します。これによって、自動タグ抽出、関連性のあるコンテンツの検出、類似コンテンツにまたがる階層的なナビゲーションなどのソリューションが可能になりました。たとえば、キーフレーズのインデックスに対してクエリを実行して、ドキュメントの編成またはコーパスに関する分類を作成することができます。また、ドキュメントの類似性のインデックスに対してクエリを実行して、ジョブの説明に一致するレジュメを特定できます。

以降の例に、セマンティック検索の機能を示します。

ドキュメント内のキーフレーズの検索

次のクエリは、サンプルドキュメントで識別されたキーフレーズを取得します。結果は、各キーフレーズの統計的有意性を順位付けするスコアの降順で表されます。このクエリは semantickeyphrasetable (Transact-SQL) 関数を呼び出します。

SET @Title = 'Sample Document.docx'  
  
SELECT @DocID = DocumentID  
    FROM Documents  
    WHERE DocumentTitle = @Title  
  
SELECT @Title AS Title, keyphrase, score  
    FROM SEMANTICKEYPHRASETABLE(Documents, *, @DocID)  
    ORDER BY score DESC

類似または関連ドキュメントの検索

次のクエリは、サンプルドキュメントに類似または関連すると識別されたドキュメントを取得します。結果は、2 つのドキュメントの類似性を順位付けするスコアの降順で表されます。このクエリは、 semanticsimilaritytable (Transact-SQL) 関数を呼び出します。

SET @Title = 'Sample Document.docx'  
  
SELECT @DocID = DocumentID  
    FROM Documents  
    WHERE DocumentTitle = @Title  
  
SELECT @Title AS SourceTitle, DocumentTitle AS MatchedTitle,  
        DocumentID, score  
    FROM SEMANTICSIMILARITYTABLE(Documents, *, @DocID)  
    INNER JOIN Documents ON DocumentID = matched_document_key  
    ORDER BY score DESC

ドキュメントの類似性または関連性を示すキーフレーズの識別

次のクエリは、2 つのサンプルドキュメント間の類似性または関連性を示すキーフレーズを取得します。結果は、各キーフレーズの重みを順位付けするスコアの降順で表されます。このクエリは、 semanticsimilaritydetailstable (Transact-SQL) 関数を呼び出します。

SET @SourceTitle = 'first.docx'  
SET @MatchedTitle = 'second.docx'  
  
SELECT @SourceDocID = DocumentID FROM Documents WHERE DocumentTitle = @SourceTitle  
SELECT @MatchedDocID = DocumentID FROM Documents WHERE DocumentTitle = @MatchedTitle  
  
SELECT @SourceTitle AS SourceTitle, @MatchedTitle AS MatchedTitle, keyphrase, score  
    FROM semanticsimilaritydetailstable(Documents, DocumentContent,  
        @SourceDocID, DocumentContent, @MatchedDocID)  
    ORDER BY score DESC

SQL Server へのドキュメントの保存

セマンティック検索を使用してドキュメントのインデックスを作成するには、そのドキュメントをSQL Server データベースに格納する必要があります。

SQL Server 2014 の FileTable 機能は、非構造化ファイルとドキュメントをリレーショナルデータベースの一流の市民にします。その結果、データベース開発者は、Transact-SQL セットベースの操作で構造化データと共にドキュメントを操作できます。

FileTable 機能の詳細については、「FileTables (SQL Server)」を参照してください。データベースにドキュメントを格納するためのもう 1 つのオプションである FILESTREAM 機能については、「FILESTREAM (SQL Server)」を参照してください。

Related Tasks

セマンティック検索のインストールと構成
統計的セマンティック検索の前提条件と、これらをインストールまたは確認する方法について説明します。

テーブルおよび列に対するセマンティック検索の有効化
ドキュメントまたはテキストが格納されている選択した列に対して統計的セマンティックインデックス作成を有効または無効にする方法について説明します。

セマンティック検索を使用したドキュメント内のキーフレーズの検索
統計的セマンティックインデックス作成用に構成されたドキュメントまたはテキスト列内のキーフレーズのクエリを実行する方法について説明します。

セマンティック検索による類似および関連したドキュメントの取得
統計的セマンティックインデックス作成用に構成されている列での、類似性または関連性のあるドキュメントやテキスト値の検索方法と、どのように類似または関連しているかという情報の検索方法について説明します。

セマンティック検索の管理および監視
セマンティックインデックス作成プロセスと、インデックスの監視および管理に関連するタスクについて説明します。

次の方法で共有

セマンティック検索 (SQL Server)

セマンティック検索で実行できる操作

ドキュメント内のキーフレーズの検索

類似または関連ドキュメントの検索

ドキュメントの類似性または関連性を示すキーフレーズの識別

SQL Server へのドキュメントの保存

Related Tasks

関連コンテンツ

その他のリソース

次の方法で共有

セマンティック検索 (SQL Server)

セマンティック検索で実行できる操作

ドキュメント内のキー フレーズの検索

類似または関連ドキュメントの検索

ドキュメントの類似性または関連性を示すキー フレーズの識別

SQL Server へのドキュメントの保存

Related Tasks

関連コンテンツ

その他のリソース

ドキュメント内のキーフレーズの検索

ドキュメントの類似性または関連性を示すキーフレーズの識別