Sémantické řazení ve službě Azure AI Search

Ve službě Azure AI Search se sémantické hodnocení měřitelně zlepšuje relevanci hledání pomocí rozpoznávání jazyka k přeřazování výsledků hledání. Tento článek představuje základní úvod. Část na konci se zabývá dostupností a cenami.

Sémantický ranker je prémiová funkce, která se účtuje podle využití. Tento článek doporučujeme pro pozadí, ale pokud chcete raději začít, postupujte takto:

Poznámka:

Sémantické řazení nepoužívá generující AI ani vektory. Pokud hledáte hledání vektorové podpory a podobnosti? Podrobnosti najdete v tématu Vektorové vyhledávání ve službě Azure AI Search .

Co je sémantické hodnocení?

Sémantický ranker je kolekce funkcí souvisejících s dotazy, které zlepšují kvalitu počátečního výsledku hledání seřazeného podle BM25 nebo RRF pro textové dotazy. Když ji povolíte ve vyhledávací službě, sémantické řazení rozšíří kanál spouštění dotazů dvěma způsoby:

  • Nejprve přidá sekundární hodnocení nad počáteční sadou výsledků, která byla vyhodnocena pomocí BM25 nebo RRF. Toto sekundární hodnocení využívá vícejazyčné modely hlubokého učení přizpůsobené Microsoft Bingu, aby podporovalo nejvíce sémanticky relevantních výsledků.

  • Za druhé, extrahuje a vrátí popis a odpovědi v odpovědi, které můžete vykreslit na vyhledávací stránce, aby se zlepšilo vyhledávání uživatele.

Tady jsou možnosti sémantického rerankeru.

Funkce Popis
Sémantické řazení Použije kontext nebo sémantický význam dotazu k výpočtu nového skóre relevance nad předem seřazenými výsledky.
Sémantické popis a zvýraznění Extrahuje doslovné věty a fráze z dokumentu, který nejlépe shrnuje obsah, a zvýrazní klíčové pasáže pro snadné skenování. Titulky, které shrnují výsledek, jsou užitečné, když jsou jednotlivá pole obsahu pro stránku výsledků hledání příliš hustá. Zvýrazněný text zvyšuje úroveň nejrelevavantnějších termínů a frází, aby uživatelé mohli rychle zjistit, proč byla shoda považována za relevantní.
Sémantické odpovědi Nepovinná a extra dílčí struktura vrácená z sémantického dotazu. Poskytuje přímou odpověď na dotaz, který vypadá jako otázka. Vyžaduje, aby dokument obsahuje text s vlastnostmi odpovědi.

Jak funguje sémantický ranker

Sémantické řazení podává dotaz a výsledky do modelů pro porozumění jazyku hostovaným Microsoftem a hledá lepší shody.

Následující obrázek vysvětluje koncept. Představte si termín "kapitál". Má různé významy v závislosti na tom, jestli je kontext finance, zákon, zeměpis nebo gramatika. Díky porozumění jazyku dokáže sémantický ranker rozpoznat kontext a zvýšit úroveň výsledků, které odpovídají záměru dotazu.

Illustration of vector representation for context.

Sémantické hodnocení je náročné jak na prostředky, tak i na čas. Aby bylo možné dokončit zpracování v rámci očekávané latence operace dotazu, jsou vstupy do sémantického rankeru sloučeny a sníženy tak, aby bylo možné co nejrychleji dokončit krok řazení.

Existují dva kroky k sémantickému řazení: shrnutí a bodování. Výstupy se skládají z výsledků rescored, popis a odpovědí.

Jak se shromažďují a shrnují vstupy

V sémantickém řazení předává subsystém dotazů výsledky hledání jako vstup pro sumarizaci a modely řazení. Vzhledem k tomu, že modely řazení mají omezení velikosti vstupu a zpracovávají náročné zpracování, musí mít výsledky hledání velikost a strukturovanou (souhrnnou) pro efektivní zpracování.

  1. Sémantické řazení začíná výsledkem seřazeným podle BM25 z textového dotazu nebo výsledku seřazeného RRF z hybridního dotazu. V rerankingu se používají pouze textová pole a k sémantickému řazení se používají pouze 50 výsledků, a to i v případě, že výsledky obsahují více než 50. Pole použitá v sémantickém řazení jsou obvykle informativní a popisná.

  2. Pro každý dokument ve výsledku hledání přijímá model sumarizace až 2 000 tokenů, kde je token přibližně 10 znaků. Vstupy se sestavují z polí "title", "keyword" a "content" uvedených v sémantické konfiguraci.

  3. Příliš dlouhé řetězce jsou oříznuté, aby se zajistilo, že celková délka splňuje vstupní požadavky kroku shrnutí. Toto cvičení oříznutí je důvod, proč je důležité přidat pole do sémantické konfigurace v pořadí priority. Pokud máte velmi velké dokumenty s poli náročnými na text, bude po maximálním limitu ignorováno cokoli.

    Sémantické pole Limit tokenů
    "title" 128 tokenů
    Klíčová slova 128 tokenů
    "obsah" zbývající tokeny
  4. Výstup souhrnu je souhrnný řetězec pro každý dokument, který se skládá z nejrelevavantnějších informací z každého pole. Souhrnné řetězce se posílají do rankeru pro bodování a strojové čtení modelů porozumění pro popis a odpovědi.

    Maximální délka každého generovaného souhrnného řetězce předaného sémantickému rankeru je 256 tokenů.

Výstupy sémantického rankeru

V každém souhrnném řetězci najdou modely porozumění strojovému čtení pasáže, které jsou nejvýraznější.

Výstupy jsou:

  • Sémantická popis dokumentu. Každý popis je k dispozici ve verzi prostého textu a ve verzi zvýraznění a často méně než 200 slov na dokument.

  • Volitelná sémantická odpověď za předpokladuanswers, že jste zadali parametr, dotaz byl položen jako otázka a v dlouhém řetězci se nachází pasáž, která poskytuje pravděpodobnou odpověď na otázku.

Titulky a odpovědi jsou vždy doslovný text z indexu. V tomto pracovním postupu neexistuje žádný model generující umělé inteligence, který vytváří nebo vytváří nový obsah.

Jak jsou souhrny vyhodnoceny

Bodování se provádí přes popis a veškerý další obsah ze souhrnného řetězce, který vyplní délku 256 tokenů.

  1. Titulky se vyhodnocují pro koncepční a sémantickou relevanci vzhledem k zadanému dotazu.

  2. Každému dokumentu se přiřadí @search.rerankerScore na základě sémantické relevance dokumentu pro daný dotaz. Skóre se pohybuje od 4 do 0 (vysoké až nízké), kde vyšší skóre označuje vyšší význam.

  3. Shody jsou uvedené v sestupném pořadí podle skóre a jsou zahrnuty do datové části odpovědi dotazu. Datová část obsahuje odpovědi, prostý text a zvýrazněné popis a všechna pole, která jste označili jako načtená nebo zadaná v klauzuli select.

Poznámka:

Od 14. července 2023 se mění distribuce @search.rerankerScore . Účinek na skóre nelze určit s výjimkou testování. Pokud máte závislost na této vlastnosti odpovědi s pevnou prahovou hodnotou, spusťte testy znovu, abyste pochopili, jaké nové hodnoty by měly být pro vaši prahovou hodnotu.

Sémantické funkce a omezení

Sémantický ranker je novější technologie, takže je důležité nastavit očekávání o tom, co může a nemůže dělat. Co může dělat:

  • Zvýšit úroveň shod, které jsou sémanticky blíže záměru původního dotazu.

  • Najděte řetězce, které se mají použít jako popis a odpovědi. Titulky a odpovědi se vrátí v odpovědi a dají se vykreslit na stránce výsledků hledání.

Co sémantické hodnocení nemůže udělat, je znovu spustit dotaz na celý korpus a najít sémanticky relevantní výsledky. Sémantické řazení přeřadí existující sadu výsledků, která se skládá z 50 nejlepších výsledků podle výchozího algoritmu řazení. Sémantické řazení navíc nemůže vytvářet nové informace ani řetězce. Titulky a odpovědi se extrahují doslovně z obsahu, takže pokud výsledky neobsahují text podobný odpovědím, jazykové modely ho nevygenerují.

I když sémantické hodnocení není v každém scénáři přínosné, může určitý obsah výrazně těžit z jeho schopností. Jazykové modely v sémantickém řazení fungují nejlépe na prohledávatelném obsahu, který je bohatý na informace a strukturovaný jako prose. Znalostní báze, online dokumentace nebo dokumenty, které obsahují popisný obsah, vidí největší zisky z sémantických možností hodnocení.

Základní technologie pochází z Bingu a Microsoft Research a je integrovaná do infrastruktury Azure AI Search jako doplňková funkce. Další informace o výzkumu a investici do sémantického hodnocení AI najdete v tématu Jak AI z Bingu podporuje Azure AI Search (blog Microsoft Research Blog).

Následující video obsahuje přehled možností.

Dostupnost a ceny

Sémantický ranker je k dispozici ve vyhledávacích službách na úrovních Basic a vyšší, a to v závislosti na regionální dostupnosti.

Když povolíte sémantický ranker, zvolte cenový plán pro tuto funkci:

  • Při nižších objemech dotazů (méně než 1 000 měsíčně) je sémantické hodnocení zdarma.
  • U vyšších objemů dotazů zvolte standardní cenový plán.

Na stránce s cenami služby Azure AI Search se zobrazuje fakturační sazba pro různé měny a intervaly.

Poplatky za sémantické řazení se účtují, když požadavky na dotazy zahrnují queryType=semantic a hledaný řetězec není prázdný (například search=pet friendly hotels in New York). Pokud je hledaný řetězec prázdný (search=*), nebude se vám nic účtovat, i když je typ dotazu nastavený na sémantickou.

Viz také