Konfigurace sémantického rankeru a vrácení titulků ve výsledcích hledání
Sémantické řazení iteruje nad počáteční sadou výsledků a používá metodologii řazení L2, která podporuje nejvíce sémanticky relevantních výsledků na začátek zásobníku. Můžete také získat sémantické titulky s nejdůležitějšími termíny a frázemi a sémantické odpovědi.
Tento článek vysvětluje, jak nakonfigurovat index vyhledávání pro sémantické reranking.
Požadavky
Vyhledávací služba na úrovni Basic nebo vyšší, v závislosti na dostupnosti oblastí.
Sémantický ranker povolený ve vyhledávací službě.
Existující index vyhledávání s obsahem rtf. Sémantické řazení se vztahuje na pole řetězců (nevector) a funguje nejlépe na obsahu, který je informativní nebo popisný.
Volba klienta
K přidání sémantické konfigurace můžete použít kterýkoli z následujících nástrojů a sad SDK:
- Azure Portal s použitím návrháře indexu přidejte sémantickou konfiguraci.
- Visual Studio Code s klientem REST
- Azure SDK pro .NET
- Azure SDK pro Python
- Azure SDK pro Javu
- Azure SDK pro JavaScript
Přidání sémantické konfigurace
Sémantická konfigurace je oddíl v indexu, který vytváří vstupy polí pro sémantické řazení. Sémantickou konfiguraci můžete kdykoli přidat nebo aktualizovat bez nutnosti opětovného sestavení. Pokud vytváříte více konfigurací, můžete zadat výchozí nastavení. V době dotazu zadejte pro požadavek dotazu sémantickou konfiguraci nebo ponechte prázdnou hodnotu, aby se použila výchozí hodnota.
Sémantická konfigurace má název a následující vlastnosti:
Vlastnost | Charakteristiky |
---|---|
Pole Název | Krátký řetězec, ideálně pod 25 slovy. Toto pole může být název dokumentu, název produktu nebo jedinečný identifikátor. Pokud nemáte vhodné pole, nechte ho prázdné. |
Pole obsahu | Delší bloky textu ve formě přirozeného jazyka, které podléhají maximálním limitům zadávání tokenů v modelech strojového učení. Mezi běžné příklady patří text dokumentu, popis produktu nebo jiný volný text. |
Pole klíčových slov | Seznam klíčových slov, jako jsou značky v dokumentu nebo popisný termín, například kategorie položky. |
Můžete zadat pouze jedno pole názvu, ale můžete mít tolik polí obsahu a klíčových slov, kolik chcete. U polí obsahu a klíčových slov vypište pole v pořadí priority, protože pole s nižší prioritou se můžou zkrátit.
Ve všech sémantických vlastnostech konfigurace musí být pole, která přiřadíte, následující:
- Atribut as
searchable
aretrievable
- Řetězce typu
Edm.String
,Collection(Edm.String)
, podpole řetězcůEdm.ComplexType
Přihlaste se k webu Azure Portal a přejděte do vyhledávací služby, která má povolené sémantické řazení.
V části Indexy v levém navigačním podokně otevřete index.
Vyberte Sémantické konfigurace a pak vyberte Přidat sémantickou konfiguraci.
Otevře se stránka Nová sémantická konfigurace s možnostmi pro výběr pole názvu, polí obsahu a polí klíčových slov. Nárok mají pouze prohledávatelná a načístelná pole řetězců. Nezapomeňte vypsat pole obsahu a pole klíčových slov v pořadí priority.
Kliknutím na TLAČÍTKO OK uložte změny.
Migrace z verzí Preview
Pokud váš sémantický kód řazení používá rozhraní API ve verzi Preview, v této části se dozvíte, jak migrovat na stabilní verze. V protokolech změn můžete zkontrolovat ověření obecné dostupnosti:
- 2024-07-01 (REST)
- Protokol změn sady Azure SDK pro .NET (11.5)
- Protokol změn sady Azure SDK pro Python (11.4)
- Protokol změn sady Azure SDK pro Javu (11.6)
- Protokol změn sady Azure SDK pro JavaScript (12.0)
Změny chování:
Od 14. července 2023 je sémantický ranker nezávislý na jazyce. Může přeřadit výsledky složené z vícejazyčného obsahu bez předsudků ke konkrétnímu jazyku. Ve verzích Preview by se sémantické řazení odlišovalo od jazyka určeného analyzátorem polí.
V roce 2021-04-30-Preview a ve všech novějších verzích definuje rozhraní REST API a všechny balíčky SDK, které cílí na stejnou verzi:
semanticConfiguration
(v definici indexu) definuje, která vyhledávací pole se používají v sémantickém řazení. Dříve se v rozhraní REST APIsearchFields
verze 2020-06-30 Preview (v požadavku dotazu) používalo pro specifikaci pole a stanovení priorit. Tento přístup fungoval pouze ve verzi 2020-06-30-Preview a je zastaralý ve všech ostatních verzích.
Krok 1: Odebrání dotazuLanguage
Sémantický modul řazení je nyní nezávislý na jazyce. Pokud queryLanguage
je zadána v logice dotazu, už se nepoužívá pro sémantické řazení, ale přesto platí pro opravu pravopisu.
Pokud používáte kontrolu pravopisu, a pokud je hodnota jazyka podporovaná pravopisem, mějte queryLanguage
na výběr. Kontrola pravopisu má omezenou dostupnost napříč jazyky.
V opačném případě odstraňte queryLanguage
.
Krok 2: Nahraďte searchFields
ho semanticConfiguration
Pokud váš kód volá balíčky REST API verze 2020-06-30 Preview nebo beta sady SDK, které cílí na tuto verzi rozhraní REST API, můžete použít searchFields
v požadavku dotazu k určení sémantických polí a priorit. V počátečních beta verzích měl dvojí účel, searchFields
omezil počáteční dotaz na pole uvedená v searchFields
poli a také nastavit prioritu pole, pokud se použilo sémantické řazení. V novějších verzích searchFields
si zachová původní účel, ale už se nepoužívá pro sémantické řazení.
Pokud ho používáte k omezení fulltextového vyhledávání na seznam pojmenovaných polí, mějte searchFields
požadavky na dotazy.
Přidejte do schématu indexu semanticConfiguration
určení priorit polí podle pokynů v tomto článku.
Další kroky
Otestujte sémantickou konfiguraci spuštěním sémantického dotazu.