Co je Azure AI Search?

Azure AI Search (dříve označované jako Azure Cognitive Search) poskytuje zabezpečené načítání informací ve velkém měřítku nad obsahem vlastněným uživatelem v tradičních a generačních vyhledávacích aplikacích AI.

Načítání informací je základem pro libovolnou aplikaci, která zvrací text a vektory. Mezi běžné scénáře patří vyhledávání katalogů nebo dokumentů, zkoumání dat a stále častěji chatovací aplikace nad proprietárními podklady dat. Při vytváření vyhledávací služby pracujete s následujícími možnostmi:

Vyhledávací služba se nachází mezi externími úložišti dat, která obsahují neindexovaná data, a klientskou aplikací, která odesílá požadavky na dotazy do indexu vyhledávání a zpracovává odpověď.

Azure AI Search architecture

V klientské aplikaci se prostředí vyhledávání definuje pomocí rozhraní API ze služby Azure AI Search a může zahrnovat ladění relevance, sémantické řazení, automatické dokončování, porovnávání synonym, přibližné shody, porovnávání vzorů, filtrování a řazení.

Azure AI Search na platformě Azure dokáže integrovat s dalšími službami Azure ve formě indexerů, které automatizují příjem a načítání dat ze zdrojů dat Azure, a sady dovedností, které zahrnují spotřební AI ze služeb Azure AI, jako je zpracování obrázků a přirozeného jazyka, nebo vlastní AI, které vytvoříte ve službě Azure Machine Učení nebo zabalení uvnitř azure Functions.

Uvnitř vyhledávací služby

V samotné vyhledávací službě se obě primární úlohy indexují a dotazují.

  • Indexování je proces příjmu, který načte obsah do vyhledávací služby a umožňuje ho prohledávat. Interně se příchozí text zpracovává na tokeny a ukládá se v invertovaných indexech a příchozí vektory se ukládají do vektorových indexů. Formát dokumentu, který může Azure AI Search indexovat, je JSON. Můžete nahrát dokumenty JSON, které jste vytvořili, nebo pomocí indexeru načíst a serializovat data do FORMÁTU JSON.

    Rozšíření AI prostřednictvím kognitivních dovedností je rozšíření indexování. Pokud máte obrázky nebo velký nestrukturovaný text ve zdrojovém dokumentu, můžete připojit dovednosti, které provádějí OCR, popisují obrázky, odvozuje strukturu, překládá text a další. Můžete také připojit dovednosti, které provádějí blokování a vektorizaci dat.

  • Dotazování může nastat, jakmile se index naplní prohledávatelným obsahem, když klientská aplikace odesílá žádosti o dotazy do vyhledávací služby a zpracovává odpovědi. Provádění všech dotazů probíhá přes index vyhledávání, který řídíte.

    Sémantické řazení je rozšíření provádění dotazů. Přidává porozumění jazyku ke zpracování výsledků hledání a podporuje nejvíce sémanticky relevantních výsledků na začátek.

Azure AI Search je vhodný pro následující scénáře aplikací:

  • Použijte ho pro tradiční fulltextové vyhledávání a vyhledávání vektorů nové generace. Back your generative AI apps with information retrieval that leverages the strength of keyword and similarity search. K načtení nejrelevavantnějších výsledků použijte oba způsoby.

  • Sloučení heterogenního obsahu do uživatelem definovaného a naplněného vyhledávacího indexu složeného z vektorů a textu. Vlastníte a řídíte, co je prohledávatelné.

  • Integrujte bloky dat a vektorizaci pro aplikace generující AI a RAG.

  • Použití podrobného řízení přístupu na úrovni dokumentu

  • Snižování zátěže indexování a dotazování úloh do vyhrazené vyhledávací služby.

  • Snadno implementujte funkce související s vyhledáváním: ladění relevance, fasetová navigace, filtry (včetně geografického vyhledávání), mapování synonym a automatické dokončování.

  • Transformujte velké nefferentiated textové nebo obrázkové soubory nebo soubory aplikací uložené ve službě Azure Blob Storage nebo Azure Cosmos DB na prohledávatelné bloky dat. Toho se dosahuje během indexování prostřednictvím kognitivních dovedností , které přidávají externí zpracování z Azure AI.

  • Přidání lingvistické nebo vlastní analýzy textu Pokud máte neanglické obsah, Azure AI Search podporuje analyzátory Lucene i procesory přirozeného jazyka Microsoftu. Analyzátory můžete také nakonfigurovat tak, aby se dosáhlo specializovaného zpracování nezpracovaného obsahu, jako je odfiltrování diakritických znamének nebo rozpoznávání a zachování vzorů v řetězcích.

Další informace o konkrétních funkcích najdete v tématu Funkce služby Azure AI Search.

Jak začít

Funkce se zveřejňují prostřednictvím webu Azure Portal, jednoduchých rozhraní REST API nebo sad Azure SDK, jako je Sada Azure SDK pro .NET. Azure Portal podporuje správu služeb a správu obsahu s nástroji pro vytváření prototypů a dotazování indexů a sad dovedností.

Komplexní zkoumání základních funkcí vyhledávání je možné provést ve čtyřech krocích:

  1. Rozhodněte se o úrovni a oblasti. Jedna bezplatná vyhledávací služba je povolená pro každé předplatné. Všechny rychlé starty je možné dokončit na úrovni Free. Pro větší kapacitu a možnosti budete potřebovat fakturovatelnou úroveň.

  2. Na webu Azure Portal vytvořte vyhledávací službu .

  3. Začněte průvodce importem dat. Zvolte předdefinovaný nebo podporovaný zdroj dat, který v minutách vytvoří, načte a dotazuje index.

  4. Dokončete Průzkumníka služby Search pomocí klienta portálu k dotazování indexu vyhledávání, který jste právě vytvořili.

Případně můžete vytvořit, načíst a dotazovat index vyhledávání v atomických krocích:

  1. Vytvořte index vyhledávání pomocí portálu, rozhraní REST API, sady .NET SDK nebo jiné sady SDK. Schéma indexu definuje strukturu prohledávatelného obsahu.

  2. Nahrání obsahu pomocí modelu push k nasdílení dokumentů JSON z libovolného zdroje nebo použití modelu pull (indexerů), pokud jsou zdrojová data podporovaného typu.

  3. Dotazování indexu pomocí Průzkumníka služby Search na portálu, rozhraní REST API, .NET SDK nebo jiné sadě SDK.

Tip

Pokud získáte pomoc se složitými nebo vlastními řešeními, obraťte se na partnera s hlubokými znalostmi technologie Azure AI Search.

Porovnání možností hledání

Zákazníci se často ptají, jak azure AI Search porovnává s jinými řešeními souvisejícími s vyhledáváním. Následující tabulka shrnuje klíčové rozdíly.

Porovnaná alternativa Klíčové rozdíly
Microsoft Search Microsoft Search je určený pro ověřené uživatele Microsoftu 365, kteří potřebují dotazovat obsah na SharePointu. Azure AI Search načítá obsah napříč Azure a libovolnou datovou sadou JSON.
Bing Rozhraní API Bingu dotazují indexy na Bing.com shodnými termíny . Azure AI Search prohledává indexy naplněné vaším obsahem. Řídíte příjem dat a schéma.
Databázové hledání SQL Server má fulltextové vyhledávání a Azure Cosmos DB a podobné technologie mají dotazovatelné indexy. Azure AI Search se stává atraktivní alternativou, pokud potřebujete funkce, jako jsou lexikální analyzátory a ladění relevance, nebo obsah z heterogenních zdrojů. Využívání prostředků je další důležitý bod. Indexování a dotazy jsou výpočetně náročné. Přesměrování načítání vyhledávání z DBMS zachovává systémové prostředky pro zpracování transakcí.
Vyhrazené řešení pro vyhledávání Za předpokladu, že jste se rozhodli pro vyhrazené vyhledávání s funkcí celého spektra, je konečné kategorické porovnání mezi technologiemi vyhledávání. Mezi poskytovateli cloudu je Azure AI Search nejsilnější pro vektorové, klíčové a hybridní úlohy nad obsahem v Azure pro aplikace, které se spoléhají především na hledání informací načítaných i navigace v obsahu.

Mezi hlavní silné stránky patří:

  • Ukládání, indexování a vkládání vektorů hledání pro věty, obrázky, grafy a další.
  • Vyhledejte informace, které jsou sémanticky podobné vyhledávacím dotazům, i když hledané termíny nejsou přesné shody.
  • Využijte hybridní vyhledávání pro nejlepší hledání klíčových slov a vektorů.
  • Ladění relevance prostřednictvím sémantických profilů hodnocení a bodování
  • Integrace dat (prohledávací moduly) ve vrstvě indexování
  • Integrace Azure AI pro transformace, které umožňují prohledávat text obsahu a vektorové vyhledávání.
  • Zabezpečení Microsoft Entra pro důvěryhodná připojení a Azure Private Link pro privátní připojení ve scénářích bez internetu.
  • Full search experience: Lingvistická a vlastní analýza textu v 56 jazycích. Fasetování, automatické dokončování dotazů a navrhovaných výsledků a synonym.
  • Škálování, spolehlivost a globální dosah Azure