Sdílet prostřednictvím


Konfigurace sémantického řazení a vrácení titulků ve výsledcích hledání

Tento článek vysvětluje, jak nakonfigurovat index vyhledávání pro sémantické reranking.

Sémantické řazení iteruje nad počáteční sadou výsledků a používá metodologii řazení L2, která podporuje nejvíce sémanticky relevantních výsledků na začátek zásobníku. Můžete také získat sémantické titulky s nejdůležitějšími termíny a frázemi a sémantické odpovědi.

Požadavky

  • Vyhledávací služba na úrovni Basic nebo vyšší, v závislosti na dostupnosti oblastí.

  • Sémantický ranker povolený ve vyhledávací službě.

  • Existující index vyhledávání s obsahem rtf. Sémantické řazení se vztahuje na pole řetězců (nevector) a funguje nejlépe na obsahu, který je informativní nebo popisný.

Volba klienta

K přidání sémantické konfigurace můžete použít kterýkoli z následujících nástrojů a sad SDK:

Přidání sémantické konfigurace

Sémantická konfigurace je oddíl v indexu, který vytváří vstupy polí pro sémantické řazení. Sémantickou konfiguraci můžete kdykoli přidat nebo aktualizovat bez nutnosti opětovného sestavení. Pokud vytváříte více konfigurací, můžete zadat výchozí nastavení. V době dotazu zadejte pro požadavek dotazu sémantickou konfiguraci nebo ponechte prázdnou hodnotu, aby se použila výchozí hodnota.

Sémantická konfigurace má název a následující vlastnosti:

Vlastnost Charakteristiky
Pole Název Krátký řetězec, ideálně pod 25 slovy. Toto pole může být název dokumentu, název produktu nebo jedinečný identifikátor. Pokud nemáte vhodné pole, nechte ho prázdné.
Pole obsahu Delší bloky textu ve formě přirozeného jazyka, které podléhají maximálním limitům zadávání tokenů v modelech strojového učení. Mezi běžné příklady patří text dokumentu, popis produktu nebo jiný volný text.
Pole klíčových slov Seznam klíčových slov, jako jsou značky v dokumentu nebo popisný termín, například kategorie položky.

Můžete zadat pouze jedno pole názvu, ale můžete mít tolik polí obsahu a klíčových slov, kolik chcete. U polí obsahu a klíčových slov vypište pole v pořadí priority, protože pole s nižší prioritou se můžou zkrátit.

Ve všech sémantických vlastnostech konfigurace musí být pole, která přiřadíte, následující:

  • Atribut as searchable a retrievable
  • Řetězce typu Edm.String, Collection(Edm.String), podpole řetězců Edm.ComplexType
  1. Přihlaste se k webu Azure Portal a přejděte do vyhledávací služby, která má povolené sémantické řazení.

  2. V části Indexy v levém navigačním podokně otevřete index.

  3. Vyberte Sémantické konfigurace a pak vyberte Přidat sémantickou konfiguraci.

    Otevře se stránka Nová sémantická konfigurace s možnostmi pro výběr pole názvu, polí obsahu a polí klíčových slov. Nárok mají pouze prohledávatelná a načístelná pole řetězců. Nezapomeňte vypsat pole obsahu a pole klíčových slov v pořadí priority.

    Snímek obrazovky, který ukazuje, jak vytvořit sémantickou konfiguraci na webu Azure Portal

    Kliknutím na TLAČÍTKO OK uložte změny.

Migrace z verzí Preview

Pokud váš sémantický kód řazení používá rozhraní API ve verzi Preview, v této části se dozvíte, jak migrovat na stabilní verze. V protokolech změn můžete zkontrolovat ověření obecné dostupnosti:

Změny chování:

  • Od 14. července 2023 je sémantický ranker nezávislý na jazyce. Může přeřadit výsledky složené z vícejazyčného obsahu bez předsudků ke konkrétnímu jazyku. Ve verzích Preview by se sémantické řazení odlišovalo od jazyka určeného analyzátorem polí.

  • V roce 2021-04-30-Preview a ve všech novějších verzích definuje rozhraní REST API a všechny balíčky SDK, které cílí na stejnou verzi: semanticConfiguration (v definici indexu) definuje, která vyhledávací pole se používají v sémantickém řazení. Dříve se v rozhraní REST API searchFields verze 2020-06-30 Preview (v požadavku dotazu) používalo pro specifikaci pole a stanovení priorit. Tento přístup fungoval pouze ve verzi 2020-06-30-Preview a je zastaralý ve všech ostatních verzích.

Krok 1: Odebrání dotazuLanguage

Sémantický modul řazení je nyní nezávislý na jazyce. Pokud queryLanguage je zadána v logice dotazu, už se nepoužívá pro sémantické řazení, ale přesto platí pro opravu pravopisu.

Pokud používáte kontrolu pravopisu, a pokud je hodnota jazyka podporovaná pravopisem, mějte queryLanguage na výběr. Kontrola pravopisu má omezenou dostupnost napříč jazyky.

V opačném případě odstraňte queryLanguage.

Krok 2: Nahraďte searchFields ho semanticConfiguration

Pokud váš kód volá balíčky REST API verze 2020-06-30 Preview nebo beta sady SDK, které cílí na tuto verzi rozhraní REST API, můžete použít searchFields v požadavku dotazu k určení sémantických polí a priorit. V počátečních beta verzích měl dvojí účel, searchFields omezil počáteční dotaz na pole uvedená v searchFieldspoli a také nastavit prioritu pole, pokud se použilo sémantické řazení. V novějších verzích searchFields si zachová původní účel, ale už se nepoužívá pro sémantické řazení.

Pokud ho používáte k omezení fulltextového vyhledávání na seznam pojmenovaných polí, mějte searchFields požadavky na dotazy.

Přidejte do schématu indexu semanticConfiguration určení priorit polí podle pokynů v tomto článku.

Další kroky

Otestujte sémantickou konfiguraci spuštěním sémantického dotazu.