Sdílet prostřednictvím


Sémantické vyhledávání (SQL Server)

platí pro:SQL Server

Statistické sémantické vyhledávání poskytuje podrobný přehled o nestrukturovaných dokumentech uložených v databázích SQL Serveru extrakcí a indexováním statisticky relevantních klíčových frází. Tyto klíčové fráze pak použije k identifikaci a indexování dokumentů, které jsou podobné nebo související.

Co můžete dělat se sémantickým vyhledáváním?

Sémantické vyhledávání vychází ze stávající funkce fulltextového vyhledávání v SQL Serveru, ale umožňuje nové scénáře, které se rozšiřují nad rámec hledání klíčových slov. Zatímco fulltextové vyhledávání umožňuje dotazovat se na slova v dokumentu, sémantické vyhledávání umožňuje analyzovat význam dokumentu. Řešení, která jsou teď možná, zahrnují automatickou extrakci značek, související zjišťování obsahu a hierarchickou navigaci v podobném obsahu. Můžete se například dotazovat na index klíčových frází, abyste vytvořili taxonomii pro organizaci nebo pro korpus dokumentů. Nebo můžete dotazovat index podobnosti dokumentu a identifikovat životopisy, které odpovídají popisu úlohy.

Následující příklady ukazují možnosti sémantického vyhledávání. Současně tyto příklady ukazují tři Transact-SQL funkce sady řádků, které použijete k dotazování sémantických indexů a načtení výsledků jako strukturovaných dat.

Vyhledání klíčových frází v dokumentu

Následující dotaz získá klíčové fráze, které byly identifikovány v ukázkovém dokumentu. Zobrazí výsledky v sestupném pořadí podle skóre, které řadí statistickou významnost jednotlivých klíčových frází.

Tento dotaz volá sémantickeyphrasetable funkci.

SET @Title = 'Sample Document.docx'  
  
SELECT @DocID = DocumentID  
    FROM Documents  
    WHERE DocumentTitle = @Title  
  
SELECT @Title AS Title, keyphrase, score  
    FROM SEMANTICKEYPHRASETABLE(Documents, *, @DocID)  
    ORDER BY score DESC  
  

Vyhledání podobných nebo souvisejících dokumentů

Následující dotaz získá dokumenty, které byly identifikovány jako podobné nebo související s ukázkovým dokumentem. Zobrazí výsledky sestupně podle skóre, které seřadí podobnost dvou dokumentů.

Tento dotaz volá funkci semanticsimilaritytable.

SET @Title = 'Sample Document.docx'  
  
SELECT @DocID = DocumentID  
    FROM Documents  
    WHERE DocumentTitle = @Title  
  
SELECT @Title AS SourceTitle, DocumentTitle AS MatchedTitle,  
        DocumentID, score  
    FROM SEMANTICSIMILARITYTABLE(Documents, *, @DocID)  
    INNER JOIN Documents ON DocumentID = matched_document_key  
    ORDER BY score DESC  
  

Vyhledání klíčových frází, které tvoří podobné dokumenty nebo související

Následující dotaz získá klíčové fráze, které vytvoří dva ukázkové dokumenty podobné nebo vzájemně související. Zobrazí výsledky v sestupném pořadí podle skóre, které seřadí váhu jednotlivých klíčových frází.

Tento dotaz volá funkci semanticsimilaritydetailstable.

SET @SourceTitle = 'first.docx'  
SET @MatchedTitle = 'second.docx'  
  
SELECT @SourceDocID = DocumentID FROM Documents WHERE DocumentTitle = @SourceTitle  
SELECT @MatchedDocID = DocumentID FROM Documents WHERE DocumentTitle = @MatchedTitle  
  
SELECT @SourceTitle AS SourceTitle, @MatchedTitle AS MatchedTitle, keyphrase, score  
    FROM semanticsimilaritydetailstable(Documents, DocumentContent,  
        @SourceDocID, DocumentContent, @MatchedDocID)  
    ORDER BY score DESC  
  

Ukládání dokumentů na SQL Serveru

Než budete moct indexovat dokumenty pomocí sémantického vyhledávání, musíte dokumenty uložit do databáze SQL Serveru.

Funkce FileTable v SQL Serveru umožňuje, aby se nestrukturované soubory a dokumenty staly plnohodnotnými částmi relační databáze. Vývojáři databází tak můžou pracovat s dokumenty společně se strukturovanými daty v Transact-SQL operacích založených na sadě.

Další informace o funkci FileTable naleznete v tématu FileTables (SQL Server). Informace o funkci FILESTREAM, která je další možností pro ukládání dokumentů v databázi, naleznete v tématu FILESTREAM (SQL Server).

Související úkoly

Instalace a konfigurace sémantického vyhledávání
Popisuje požadavky pro statistické sémantické vyhledávání a způsob jejich instalace nebo kontroly.

Povolení sémantického vyhledávání tabulek a sloupců
Popisuje, jak povolit nebo zakázat statistické sémantické indexování u vybraných sloupců, které obsahují dokumenty nebo text.

Hledání klíčových frází v dokumentech pomocí sémantického vyhledávání
Popisuje, jak najít klíčové fráze v dokumentech nebo textových sloupcích nakonfigurovaných pro statistické sémantické indexování.

Vyhledání podobných a souvisejících dokumentů pomocí sémantického vyhledávání
Popisuje, jak najít podobné nebo související dokumenty nebo textové hodnoty a informace o tom, jak jsou podobné nebo související, ve sloupcích nakonfigurovaných pro statistické sémantické indexování.

Spravovat a monitorovat sémantické vyhledávání
Popisuje proces sémantického indexování a úloh souvisejících s monitorováním a správou indexů.

Související obsah

Sémantické vyhledávání DDL, funkce, uložené procedury a zobrazení
Vypíše příkazy Transact-SQL a databázové objekty SQL Serveru přidané nebo změněné tak, aby podporovaly statistické sémantické vyhledávání.