Funkce služby Azure AI Search

Azure AI Search poskytuje načítání informací a využívá volitelnou integraci AI k extrakci dalšího obsahu textu a struktury.

Následující tabulka shrnuje funkce podle kategorií. Další informace o porovnání služby Azure AI Search s jinými technologiemi vyhledávání najdete v tématu Porovnání možností hledání.

Ve všech veřejných, privátních a suverénníchcloudch Další informace najdete v tématu Dostupnost produktů v jednotlivých oblastech.

Poznámka:

Hledáte funkce ve verzi Preview? Podívejte se na seznam funkcí ve verzi Preview.

Funkce indexování

Kategorie Funkce
Zdroje dat Indexy vyhledávání můžou přijímat text z libovolného zdroje za předpokladu, že je odeslán jako dokument JSON.

Indexery jsou funkce, která automatizuje import dat z podporovaných zdrojů dat a extrahuje prohledávatelný obsah v primárních úložištích dat. Indexery zpracovávají serializaci JSON za vás a většina podporuje nějakou formu detekce změn a odstranění. Můžete se připojit k nejrůznějším zdrojům dat, včetně Azure SQL Database, Azure Cosmos DB nebo Úložiště objektů blob v Azure.
Hierarchické a vnořené datové struktury Komplexní typy a kolekce umožňují modelovat prakticky jakýkoli typ struktury JSON v indexu vyhledávání. Kardinalitu 1:N a M:N lze nativně vyjádřit prostřednictvím kolekcí, komplexních typů a kolekcí komplexních typů.
Lingvistická analýza Analyzátory jsou komponenty, které slouží ke zpracování textu během operací indexování a vyhledávání. Ve výchozím nastavení můžete použít analyzátor Lucene pro obecné účely nebo přepsat výchozí pomocí analyzátoru jazyka, vlastního analyzátoru, který nakonfigurujete, nebo jiného předdefinovaného analyzátoru, který vytváří tokeny ve formátu, který požadujete.

Jazykové analyzátory od Lucene nebo Microsoftu se používají k inteligentnímu zpracování lingvistiky pro konkrétní jazyk včetně časů sloves, rodu, nepravidelného množného čísla podstatných jmen (například anglické „mouse“ oproti „mice“), rozkladu slov, dělení slov (pro jazyky bez mezer) a dalších možností.

Vlastní lexikální analyzátory se používají pro komplexní formuláře dotazů, jako jsou fonetické porovnávání a regulární výrazy.

Kategorie Funkce
Indexování vektorů V indexu vyhledávání přidejte vektorová pole pro podporu scénářů vektorového vyhledávání. Vektorová pole můžou existovat společně s nevectorovými poli ve stejném vyhledávacím dokumentu.
Vektorové dotazy Formulujte jednoúčelové a více vektorových dotazů.
Vektorové vyhledávací algoritmy Pomocí hierarchického navigace Small World (HNSW) nebo úplným k-nejbližším sousedům (KNN) můžete najít podobné vektory v indexu vyhledávání.
Vektorové filtry Použijte filtry před nebo po spuštění dotazu pro větší přesnost během načítání informací.
Načtení hybridních informací Vyhledejte koncepty a klíčová slova v jednom požadavku hybridního dotazu.

Hybridní vyhledávání konsoliduje vektorové a textové vyhledávání s volitelným sémantickým řazením a laděním relevance pro nejlepší výsledky.
Integrované blokování a vektorizace dat (Preview) Nativní blokování dat prostřednictvím dovednosti Rozdělení textu a nativní vektorizace prostřednictvím vektorizátorů a dovednosti AzureOpenAIEmbeddingModel.

Integrovaná vektorizace (Preview) poskytuje komplexní indexovací kanál ze zdrojových souborů do dotazů.
Komprese a kvantování integrovaných vektorů Pomocí předdefinované skalární kvantování zmenšete velikost vektorového indexu v paměti a na disku. Můžete také předepisovat ukládání vektorů, které nepotřebujete, nebo přiřazovat úzké datové typy k vektorovým polím kvůli nižším požadavkům na úložiště.
Import a vektorizace dat (Preview) Nový průvodce na webu Azure Portal, který vytvoří úplný kanál indexování, který zahrnuje bloky dat a vektorizaci. Průvodce vytvoří všechny objekty a nastavení konfigurace.

Rozšiřování AI a dolování znalostí

Kategorie Funkce
Zpracování AI během indexování Obohacení AI odkazuje na vložené zpracování obrázků a přirozeného jazyka v kanálu indexeru, který extrahuje text a informace z obsahu, který se jinak nedá indexovat pro fulltextové vyhledávání. Zpracování umělé inteligence se dosahuje přidáním a kombinováním dovedností v sadě dovedností, která se pak připojí k indexeru. AI může být buď předdefinovaná, od Microsoftu, jako je překlad textu nebo optické rozpoznávání znaků (OCR), nebo vlastní dovednosti , které poskytujete.
Ukládání rozšířeného obsahu pro analýzu a spotřebu ve scénářích bez vyhledávání Úložiště znalostí je trvalé úložiště rozšířeného obsahu určeného pro scénáře bez vyhledávání, jako je dolování znalostí a zpracování datových věd. Úložiště znalostí je definováno v sadě dovedností, ale ve službě Azure Storage se vytváří jako objekty nebo tabulkové sady řádků.
Rozšíření uložená v mezipaměti Přírůstkové rozšiřování (Preview) odkazuje na rozšiřování v mezipaměti, které je možné znovu použít během provádění sady dovedností. Ukládání do mezipaměti je obzvláště cenný v sadách dovedností, které zahrnují analýzu OCR a obrázků, což je nákladné zpracovat.

Dotazování a uživatelské prostředí

Kategorie Funkce
Hledání v textu volného tvaru Fulltextové vyhledávání je primární případ použití většiny vyhledávacích aplikací. Dotazy se dají formulovat pomocí podporované syntaxe.

Jednoduchá syntaxe dotazů poskytuje logické operátory, operátory pro hledání slovních spojení, operátory pro přípony a operátory priority.

Úplná syntaxe dotazů Lucene zahrnuje všechny operace v jednoduché syntaxi s rozšířeními pro vyhledávání přibližných shod, vyhledávání bezkontaktní komunikace, zvýšení termínu a regulární výrazy.
Relevance Jednoduché bodování je klíčovou výhodou služby Azure AI Search. Profily vyhodnocování (bodovací profily) se používají k modelování relevance jako funkce hodnot v samotných dokumentech. Můžete například chtít, aby se novější produkty nebo produkty se slevou zobrazovaly ve výsledcích hledání na vyšších pozicích. Můžete také vytvořit profily vyhodnocování pomocí značek pro individuální vyhodnocování podle preferencí vyhledávání zákazníků, které sledujete a ukládáte odděleně.

Sémantický ranker je funkce Premium, která přeřazuje výsledky na základě sémantické relevance dotazu. V závislosti na vašem obsahu a scénáři může výrazně zlepšit relevanci vyhledávání s téměř minimální konfigurací nebo úsilím.
Geoprostorové vyhledávání Geoprostorové funkce filtrují a odpovídají zeměpisným souřadnicům. Můžete se shodovat s vzdáleností nebo zahrnutím do mnohoúhelníku.
Filtry a omezující vlastnosti Fasetová navigace se aktivuje jedním parametrem dotazu. Azure AI Search vrátí fasetovou navigační strukturu, kterou můžete použít jako kód za seznamem kategorií pro vlastní filtrování (například k filtrování položek katalogu podle cenového rozsahu nebo značky).

Filtry se dají použít k začlenění fasetové navigace do uživatelského rozhraní aplikace, rozšíření možností formulování dotazu a filtrování na základě kritérií zadaných uživatelem nebo vývojářem. Filtry se vytvářejí pomocí syntaxe OData.
Uživatelské prostředí Automatické dokončování je možné povolit pro dotazy s předstihem na panelu hledání.

Návrhy hledání fungují také s částečnými textovými vstupy na panelu hledání, ale výsledky jsou skutečné dokumenty ve vašem indexu, a ne termíny dotazu.

Synonyma přidružují ekvivalentní termíny, které implicitně rozšiřují rozsah dotazu, aniž by uživatel musel zadávat alternativní termíny.

Zvýrazňování nalezených položek použije formátování textu na odpovídající klíčové slovo ve výsledcích hledání. Můžete si zvolit pole, která budou vracet zvýrazněné fragmenty.

Řazení se poskytuje pro několik polí prostřednictvím schématu indexu. Zapíná se pak v době dotazu jedním parametrem vyhledávání.

Stránkování a omezování výsledků hledání je jednoduché pomocí jemně vyladěného ovládacího prvku, který Azure AI Search nabízí nad výsledky hledání.

Funkce zabezpečení

Kategorie Funkce
Šifrování dat Šifrování neaktivních uložených uložených dat spravované microsoftem je integrované do interní vrstvy úložiště a je neodvolatelné.

Šifrovací klíče spravované zákazníkem, které vytvoříte a spravujete ve službě Azure Key Vault, můžete použít k dodatečnému šifrování indexů a map synonym. Pro služby vytvořené po 1. srpnu 2020 se šifrování CMK rozšiřuje na data na dočasných discích pro úplné dvojité šifrování indexovaného obsahu.
Ochrana koncových bodů Pravidla PROTOKOLU IP pro podporu příchozí brány firewall umožňují nastavit rozsahy IP adres, ve kterých bude vyhledávací služba přijímat požadavky.

Vytvoření privátního koncového bodu pomocí služby Azure Private Link k vynucení všech požadavků prostřednictvím virtuální sítě
Příchozí přístup Řízení přístupu na základě role v Azure přiřazuje role uživatelům a skupinám v MICROSOFT Entra ID pro řízený přístup k obsahu a operacím vyhledávání. Ověřování na základě klíčů můžete použít také v případě, že nemáte tenanta Azure.
Odchozí zabezpečení (indexery) Přístup k datům prostřednictvím privátních koncových bodů umožňuje indexeru připojit se k prostředkům Azure, které jsou chráněné prostřednictvím služby Azure Private Link.

Přístup k datům pomocí důvěryhodné identity znamená, že připojovací řetězec externím zdrojům dat může vynechat uživatelská jména a hesla. Když se indexer připojí ke zdroji dat, prostředek umožňuje připojení, pokud byla vyhledávací služba dříve zaregistrována jako důvěryhodná služba.

Funkce portálu

Kategorie Funkce
Nástroje pro vytváření prototypů a kontrolu Přidání indexu je návrhář indexu na portálu, který můžete použít k vytvoření základního schématu sestávajícího z přiřazených polí a několika dalších nastavení. Po uložení indexu ho můžete naplnit pomocí sady SDK nebo rozhraní REST API k poskytnutí dat.

Průvodce importem dat vytvoří indexy, indexery, sady dovedností a definice zdrojů dat. Pokud vaše data existují v Azure, může vám tento průvodce ušetřit významný čas a úsilí, zejména při testování konceptu a zkoumání.

Průzkumník služby Search se používá k testování dotazů a upřesňování profilů bodování.

Vytvoření ukázkové aplikace slouží k vygenerování stránky HTML, která se dá použít k otestování vyhledávacího prostředí.

Ladicí relace je vizuální editor, který umožňuje interaktivně ladit sadu dovedností. Zobrazuje závislosti, výstup a transformace.
Monitorování a diagnostika Povolte funkce monitorování, aby nepřesáhly přehled metriky, které jsou vždy viditelné na portálu. Metriky týkající se dotazů za sekundu, latence a omezování se zaznamenávají a hlásí na stránkách portálu bez nutnosti další konfigurace.

Programovatelnost

Kategorie Funkce
REST Rozhraní REST API služby je určené pro operace roviny dat, včetně všech operací souvisejících s indexováním, dotazy a rozšiřováním AI. Tuto klientskou knihovnu můžete také použít k načtení systémových informací a statistik.

Rozhraní REST API pro správu je určené k vytváření a zřizování služeb prostřednictvím Azure Resource Manageru. Toto rozhraní API můžete také použít ke správě klíčů a kapacity.
Sada Azure SDK pro .NET Azure.Search.Documents slouží k operacím roviny dat, včetně všech operací souvisejících s indexováním, dotazy a rozšiřováním AI. Tuto klientskou knihovnu můžete také použít k načtení systémových informací a statistik.

Microsoft.Azure.Management.Search slouží k vytváření a zřizování služeb prostřednictvím Azure Resource Manageru. Toto rozhraní API můžete také použít ke správě klíčů a kapacity.
Azure SDK pro Javu com.azure.search.documents slouží k operacím roviny dat, včetně všech operací souvisejících s indexováním, dotazy a rozšiřováním AI. Tuto klientskou knihovnu můžete také použít k načtení systémových informací a statistik.

com.microsoft.azure.management.search slouží k vytváření a zřizování služeb prostřednictvím Azure Resource Manageru. Toto rozhraní API můžete také použít ke správě klíčů a kapacity.
Azure SDK pro Python Dokumenty azure-search jsou určené pro operace roviny dat, včetně všech operací souvisejících s indexováním, dotazy a rozšiřováním AI. Tuto klientskou knihovnu můžete také použít k načtení systémových informací a statistik.

Azure-mgmt-search slouží k vytváření a zřizování služeb prostřednictvím Azure Resource Manageru. Toto rozhraní API můžete také použít ke správě klíčů a kapacity.
Azure SDK pro JavaScript nebo TypeScript Azure/search-documents slouží k operacím roviny dat, včetně všech operací souvisejících s indexováním, dotazy a rozšiřováním AI. Tuto klientskou knihovnu můžete také použít k načtení systémových informací a statistik.

Azure/arm-search slouží k vytváření a zřizování služeb prostřednictvím Azure Resource Manageru. Toto rozhraní API můžete také použít ke správě klíčů a kapacity.

Viz také