Поделиться через


Поиск похожих и связанных документов с использованием семантического поиска

Описывает процесс поиска схожих или связанных документов или текстовых значений и сведений об их сходстве или связи в столбцах, настроенных для статистического семантического индексирования.

В этом разделе

Необходимо...

  • Найти схожие или связанные документы

    • Как найти аналогичные или связанные документы с помощью функции SEMANTICSIMILARITYTABLE

    • Пример. Поиск наиболее важных документов, больше всего схожих с другим документом

  • Поиск сведений о схожести или связи документов

    • Как найти сведения о схожести или связи документов с помощью функции SEMANTICSIMILARITYDETAILSTABLE

    • Пример. Поиск ключевых фраз, которые больше всего схожи в разных документах

Поиск схожих или связанных документов

Как найти аналогичные или связанные документы с помощью функции SEMANTICSIMILARITYTABLE

Чтобы найти схожие или связанные документы в данном столбце, запросите функцию semanticsimilaritytable (Transact-SQL).

Функция SEMANTICSIMILARITYTABLE возвращает таблицу, состоящую из нуля, одной или нескольких строк, содержимое которых в указанном столбце семантически схоже с заданным документом. На эту функцию набора строк можно ссылаться в предложении FROM инструкции SELECT как на обычное имя таблицы.

Искать схожие документы по разным столбцам невозможно. Функция SEMANTICSIMILARITYTABLE извлекает результаты только из столбца, совпадающего с исходным столбцом, определяемым аргументом source_key.

Подробные сведения о параметрах функции SEMANTICSIMILARITYTABLE и о возвращаемой таблице результатов см. в разделе semanticsimilaritytable (Transact-SQL).

Важное примечаниеВажно!

Для целевых столбцов должно быть включено полнотекстовое и семантическое индексирование.

[В начало]

Пример. Поиск наиболее важных документов, больше всего схожих с другим документом

В следующем примере извлекается до 10 кандидатов, подобных указанному кандидату, обозначенному @CandidateID из таблицы HumanResources.JobCandidate в образце базы данных AdventureWorks2012.

SELECT TOP(10) KEY_TBL.matched_document_key AS Candidate_ID
FROM SEMANTICSIMILARITYTABLE
    (
    HumanResources.JobCandidate,
    Resume,
    @CandidateID
    ) AS KEY_TBL
ORDER BY KEY_TBL.score DESC;
GO

[В начало]

Поиск сведений о схожести или связи документов

Как искать сведения о схожести или связи документов с помощью функции SEMANTICSIMILARITYDETAILSTABLE

Чтобы получить дополнительные сведения о ключевых фразах, которые делают документы схожими или связанными, вызовите функцию semanticsimilaritydetailstable (Transact-SQL).

Функция SEMANTICSIMILARITYDETAILSTABLE возвращает таблицу из нуля, одной или нескольких строк с ключевыми фразами, общими для двух документов (исходного документа и сопоставленного документа), содержимое которых семантически схоже. На эту функцию набора строк можно ссылаться в предложении FROM инструкции SELECT как на обычное имя таблицы.

Подробные сведения о параметрах функции SEMANTICSIMILARITYDETAILSTABLE и о возвращаемой таблице результатов см. в разделе semanticsimilaritydetailstable (Transact-SQL).

Важное примечаниеВажно!

Для целевых столбцов должно быть включено полнотекстовое и семантическое индексирование.

[В начало]

Пример. Поиск ключевых фраз, которые больше всего схожи в разных документах

В следующем примере производится извлечение 5 ключевых фраз, имеющих высший показатель подобия среди указанных кандидатов в таблице HumanResources.JobCandidate образца базы данных AdventureWorks20012.

SELECT TOP(5) KEY_TBL.keyphrase, KEY_TBL.score
FROM SEMANTICSIMILARITYDETAILSTABLE
    (
    HumanResources.JobCandidate,
    Resume, @CandidateID,
    Resume, @MatchedID
    ) AS KEY_TBL
ORDER BY KEY_TBL.score DESC;
GO

[В начало]