Sémantické řazení ve službě Azure AI Search

2025-06-10

Ve službě Azure AI Search je sémantický ranker funkcí, která měřitelně zlepšuje relevanci vyhledávání pomocí modelů Microsoftu pro rozpoznávání jazyka k přeřazování výsledků hledání. Tento článek je základní úvod, který vám pomůže pochopit chování a výhody sémantického rankeru.

Sémantický ranker je prémiová funkce, která se účtuje podle využití. Tento článek doporučujeme pro pozadí, ale pokud chcete raději začít, postupujte podle těchto kroků.

Poznámka:

Sémantický ranker nepoužívá generování AI ani vektorů pro řazení sekundární úrovně 2 (L2). Pokud hledáte vektory a vyhledávání podobnosti, přečtěte si téma Vektorové vyhledávání ve službě Azure AI Search.

Co je sémantické hodnocení?

Sémantický ranker je kolekce funkcí na straně dotazu, které zlepšují kvalitu počátečního výsledku hledání seřazeného podle BM25 nebo RRF pro textové dotazy, textovou část vektorových dotazů a hybridní dotazy. Sémantické řazení rozšiřuje kanál spouštění dotazů třemi způsoby:

Nejprve vždy přidá sekundární hodnocení k počáteční sadě výsledků, která byla vyhodnocena pomocí BM25 nebo pomocí Reciprocal Rank Fusion (RRF). Toto sekundární hodnocení využívá vícejazyčné modely hlubokého učení přizpůsobené Microsoft Bingu, aby podporovalo nejvíce sémanticky relevantních výsledků.
Za druhé vrátí titulky a volitelně extrahuje odpovědi v odpovědi, které můžete vykreslit na vyhledávací stránce, aby se zlepšilo vyhledávání uživatele.
Za třetí, pokud povolíte přepsání dotazu, rozbalí počáteční řetězec dotazu na více sémanticky podobných řetězců dotazu.

Sekundární řazení a "odpovědi" se vztahují na odpověď na dotaz. Přepsání dotazu je součástí požadavku.

Tady jsou možnosti sémantického rerankeru.

Schopnost	Popis
Pořadí L2	Použije kontext nebo sémantický význam dotazu k výpočtu nového skóre relevance nad předem seřazenými výsledky.
Sémantické titulky a zvýraznění	Extrahuje doslovné věty a fráze z polí, která nejlépe shrnují obsah, a zvýrazní klíčové pasáže pro snadné skenování. Titulky, které shrnují výsledek, jsou užitečné, když jsou jednotlivá pole obsahu pro stránku výsledků hledání příliš hustá. Zvýrazněný text zvyšuje úroveň nejrelevavantnějších termínů a frází, aby uživatelé mohli rychle zjistit, proč byla shoda považována za relevantní.
Sémantické odpovědi	Nepovinná a dodatečná podstruktura vrácená ze sémantického dotazu. Poskytuje přímou odpověď na dotaz, který vypadá jako otázka. Vyžaduje, aby dokument obsahuje text s vlastnostmi odpovědi.
Přepsání dotazu	Pomocí textových dotazů nebo textové části vektorového dotazu vytvoří sémantický ranker až 10 variant dotazu, třeba opraví překlepy nebo pravopisné chyby nebo přehraje dotaz pomocí vygenerovaných synonym. Přepsaný dotaz se spustí na vyhledávacím webu. Výsledky jsou skórovány pomocí BM25 nebo RRF a následně jsou znovu hodnoceny sémantickým rankerem.

Jak funguje sémantický ranker

Sémantic ranker feeds a query and results to language understanding models hosted by Microsoft and scans for better matches.

Následující obrázek vysvětluje koncept. Představte si termín "kapitál". Má různé významy v závislosti na tom, jestli je kontext finance, zákon, zeměpis nebo gramatika. Díky porozumění jazyku dokáže sémantický ranker rozpoznat kontext a zvýšit úroveň výsledků, které odpovídají záměru dotazu.

Sémantické hodnocení je náročné jak na prostředky, tak i na čas. Aby bylo možné dokončit zpracování v rámci očekávané latence operace dotazu, jsou vstupy do sémantického rankeru sloučeny a sníženy tak, aby bylo možné co nejrychleji dokončit krok řazení.

Existují tři kroky k sémantickému řazení:

Shromažďování a shrnutí vstupů
Vyhodnoťte výsledky pomocí sémantického rankeru
Výsledky po přehodnocení, titulky a odpovědi

Jak se shromažďují a shrnují vstupy

V sémantickém řazení předává subsystém dotazů výsledky hledání jako vstup pro sumarizaci a modely řazení. Vzhledem k tomu, že modely řazení mají omezení velikosti vstupu a zpracovávají náročné zpracování, musí mít výsledky hledání velikost a strukturovanou (souhrnnou) pro efektivní zpracování.

Sémantický ranker začíná výsledkem seřazeným podle BM25 z textového dotazu nebo výsledku seřazeného RRF z vektoru nebo hybridního dotazu. V rerankingu se používá pouze text a k sémantickému hodnocení postupuje pouze 50 nejlepších výsledků, i když výsledků může být více než 50. Pole použitá v sémantickém řazení jsou obvykle informativní a popisná.
Pro každý dokument ve výsledku hledání přijímá model sumarizace až 2 000 tokenů, kde je token přibližně 10 znaků. Vstupy se sestavují z polí "title", "keyword" a "content" uvedených v sémantické konfiguraci.
Příliš dlouhé řetězce jsou oříznuté, aby se zajistilo, že celková délka splňuje vstupní požadavky kroku shrnutí. Toto cvičení zaměřené na oříznutí je důvod, proč je prioritní přidávat pole do sémantické konfigurace v prioritním pořadí. Pokud máte velmi velké dokumenty s poli náročnými na text, bude po maximálním limitu ignorováno cokoli.

Sémantické pole Limit tokenů

název 128 tokenů

Klíčová slova 128 tokenů

obsah zbývající tokeny
Výstup souhrnu je souhrnný řetězec pro každý dokument, který se skládá z nejrelevavantnějších informací z každého pole. Souhrnné řetězce se posílají do rankeru pro skórování a do modelů strojového porozumění textu pro generování titulků a odpovědí.

Od listopadu 2024 je maximální délka každého generovaného souhrnného řetězce předaného sémantickému rankeru 2 048 tokenů. Dříve to bylo 256 tokenů.

Sémantické pole	Limit tokenů
název	128 tokenů
Klíčová slova	128 tokenů
obsah	zbývající tokeny

Jak se hodnocení vyhodnotí

Bodování se provádí přes titulek a veškerý další obsah ze souhrnného řetězce, který vyplní délku 2 048 tokenů.

Titulky se vyhodnocují pro koncepční a sémantickou relevanci vzhledem k zadanému dotazu.

Každému dokumentu se přiřadí @search.rerankerScore na základě sémantické relevance dokumentu pro daný dotaz. Skóre se pohybuje od 4 do 0 (vysoké až nízké), kde vyšší skóre označuje vyšší význam.

Skóre	Význam
4.0	Dokument je vysoce relevantní a zcela odpovídá na otázku, i když část může obsahovat další text nesouvisející s otázkou.
3,0	Dokument je relevantní, ale chybí podrobnosti, které by ho dokončily.
2.0	Dokument je poněkud relevantní; odpovídá na otázku buď částečně, nebo pouze na některé aspekty otázky.
1.0	Dokument souvisí s otázkou a odpovídá na malou část.
0,0	Dokument není relevantní.

Shody jsou uvedené v sestupném pořadí podle skóre a jsou zahrnuty do datové části odpovědi dotazu. Datová část obsahuje odpovědi, prostý text a zvýrazněné titulky a všechna pole, která jste označili jako načtená nebo zadaná v klauzuli select.

Poznámka:

U každého dotazu mohou distribuce @search.rerankerScore vykazovat mírné odchylky z důvodu podmínek na úrovni infrastruktury. O aktualizacích modelu řazení se také vědělo, že mají vliv na distribuci. Z těchto důvodů, pokud píšete vlastní kód pro minimální prahové hodnoty nebo nastavíte vlastnost prahové hodnoty pro vektorové a hybridní dotazy, nevytvářejte limity příliš podrobné.

Výstupy sémantického rankeru

V každém souhrnném řetězci najdou modely porozumění strojovému čtení pasáže, které jsou nejvýraznější.

Výstupy jsou:

Sémantický titulek dokumentu. Každý titulek je k dispozici ve verzi prostého textu a ve verzi zvýraznění a často je méně než 200 slov na dokument.
Volitelná sémantická odpověď za předpokladuanswers, že jste zadali parametr, dotaz byl položen jako otázka a v dlouhém řetězci se nachází pasáž, která poskytuje pravděpodobnou odpověď na otázku.

Titulky a odpovědi jsou vždy doslovný text z indexu. V tomto pracovním postupu neexistuje žádný generativní model umělé inteligence, který vytváří nebo skládá nový obsah.

Sémantické funkce a omezení

Co může sémantický ranker dělat:

Zvýšit úroveň shod, které jsou sémanticky blíže záměru původního dotazu.
Najděte řetězce, které se mají použít jako titulky a odpovědi. Popisky a odpovědi jsou vráceny v odpovědi a lze je zobrazit na stránce výsledků hledání.

To, co sémantický ranker nemůže udělat, je znovu spustit dotaz na celý korpus a najít sémanticky relevantní výsledky. Sémantické řazení přeřadí existující sadu výsledků, která se skládá z 50 nejlepších výsledků podle výchozího algoritmu řazení. Sémantický ranker navíc nemůže vytvářet nové informace ani řetězce. Titulky a odpovědi se extrahují doslovně z obsahu, takže pokud výsledky neobsahují text podobný odpovědím, jazykové modely ho nevygenerují.

I když sémantické hodnocení není v každém scénáři přínosné, může určitý obsah výrazně těžit z jeho schopností. Jazykové modely v sémantických hodnoceních fungují nejlépe na prohledávatelném obsahu, který je bohatý na informace a strukturovaný jako próza. Znalostní báze, online dokumentace nebo dokumenty, které obsahují popisný obsah, vykazují největší přínosy ze sémantických schopností rankeru.

Základní technologie pochází z Bingu a Microsoft Research a je integrovaná do infrastruktury Azure AI Search jako doplňková funkce. Další informace o výzkumu a investicích do AI v sémantických rankerech najdete v tématu Jak AI z Bingu podporuje Azure AI Search (Blog Microsoft Research Blog).

Následující video obsahuje přehled možností.

Jak sémantický ranker používá mapy synonym

Pokud jste už povolili podporu pro mapy synonym přidružených k poli v indexu vyhledávání a toto pole je součástí konfigurace sémantického rankeru, sémantický ranker automaticky použije nakonfigurované synonyma během procesu opětovného řazení.

Dostupnost a ceny

Sémantický ranker je k dispozici ve vyhledávacích službách na úrovních Basic a vyšší, a to v závislosti na regionální dostupnosti.

Při konfiguraci sémantického rankeru zvolte cenový plán pro tuto funkci:

Při nižších objemech dotazů (méně než 1 000 měsíčně) je sémantické hodnocení zdarma.
U vyšších objemů dotazů zvolte standardní cenový plán.

Na stránce s cenami služby Azure AI Search se zobrazuje fakturační sazba pro různé měny a intervaly.

Poplatky za sémantické rankery se účtují, když požadavky na dotazy zahrnují queryType=semantic a hledaný řetězec není prázdný (například search=pet friendly hotels in New York). Pokud je hledaný řetězec prázdný (search=*), nebude se vám nic účtovat, i když je typ dotazu nastavený na sémantickou.

Jak začít s sémantickým rankerem

Zkontrolujte dostupnost v jednotlivých oblastech.
Přihlaste se k webu Azure Portal a ověřte, že je vaše vyhledávací služba Basic nebo vyšší.
Nakonfigurujte sémantický ranker pro vyhledávací službu a zvolte cenový plán.
Nakonfigurujte sémantický ranker v indexu vyhledávání.
Nastavte dotazy tak, aby vracely sémantické titulky a zvýraznění.
Volitelně můžete vrátit sémantické odpovědi.

Viz také

Blog: Překonávání vyhledávání pomocí vektorů s hybridními schopnostmi vyhledávání a hodnocení