Rychlý start: Vytvoření indexu Azure Cognitive Search v Azure Portal

V tomto rychlém startu vytvoříte svůj první vyhledávací index pomocí průvodce importem dat a integrovaného ukázkového zdroje dat, který se skládá z fiktivních hotelových dat. Průvodce vás provede vytvořením indexu vyhledávání (hotels-sample-index), abyste mohli během několika minut psát zajímavé dotazy.

Přestože nebudete používat možnosti v tomto rychlém startu, průvodce obsahuje stránku pro rozšíření AI, abyste mohli extrahovat text a strukturu ze souborů obrázků a nestrukturovaného textu. Podobný návod, který zahrnuje rozšiřování AI, najdete v tématu Rychlý start: Vytvoření sady dovedností.

Požadavky

Kontrola místa

Mnoho zákazníků začíná s bezplatnou službou. Úroveň Free je omezená na tři indexy, tři zdroje dat a tři indexery. Než začnete, ujistěte se, že máte místo pro další položky. Tento rychlý start vytvoří jeden z každého objektu.

Podívejte se na stránku s přehledem služby a zjistěte, kolik indexů, indexerů a zdrojů dat už máte.

Snímek obrazovky se seznamy indexů, indexerů a zdrojů dat na řídicím panelu služby

Vytvoření a načtení indexu

Vyhledávací dotazy iterují nad indexem , který obsahuje prohledávatelná data, metadata a další konstrukce, které optimalizují určité chování hledání.

V tomto rychlém startu vytvoříme a načteme index pomocí předdefinované ukázkové datové sady, kterou můžete procházet pomocí indexeru prostřednictvím průvodce importem dat. Ukázková datová sada hotelů je hostovaná na Microsoft ve službě Azure Cosmos DB a přístupná přes interní připojení. Pro přístup k datům nepotřebujete vlastní účet služby Cosmos DB ani zdrojové soubory.

Indexer je prohledávací modul pro určitý zdroj, který dokáže číst metadata a obsah z podporovaných zdrojů dat Azure. Indexery se obvykle vytvářejí programově, ale na portálu je můžete vytvořit pomocí průvodce importem dat.

Krok 1 : Spuštění průvodce importem dat a vytvoření zdroje dat

  1. Přihlaste se k webu Azure Portal pomocí svého účtu Azure.

  2. Vyhledejte vyhledávací službu a na stránce Přehled vyberte Importovat data na panelu příkazů, abyste vytvořili a naplňte vyhledávací index.

    Snímek obrazovky s příkazem Importovat data na panelu příkazů

  3. V průvodci vyberte Připojit k datům>Ukázky>hotels-sample. Tento zdroj dat je integrovaný. Pokud byste vytvářeli vlastní zdroj dat, museli byste zadat název, typ a informace o připojení. Po vytvoření se z něj stane „existující zdroj dat“, který je možné využít v dalších operacích importu.

    Snímek obrazovky se stránkou vybrat ukázkovou datovou sadu v průvodci

  4. Pokračujte na další stránku.

Krok 2 – Přeskočení stránky Obohacení obsahu

Průvodce podporuje vytvoření kanálu rozšíření AI pro začlenění algoritmů AI služeb Cognitive Services do indexování.

Tento krok prozatím přeskočíme a přejdeme přímo k přizpůsobení cílového indexu.

Snímek obrazovky s tlačítkem Přeskočit kognitivní dovednosti v průvodci

Tip

Příklad indexování AI si můžete projít v rychlém startu nebo kurzu.

Krok 3 – konfigurace indexu

Pro předdefinovaný ukázkový index hotelů je pro vás definováno výchozí schéma indexu. S výjimkou několika pokročilých příkladů filtrů se dotazy v dokumentaci a ukázky, které cílí na index hotel-samples, spustí na této definici indexu:

Snímek obrazovky s vygenerovanou definicí indexu hotelů v průvodci

Ve cvičení založeném na kódu se obvykle vytvoření indexu dokončí před načtením dat. Průvodce importem dat tyto kroky zkondenzuje generováním základního indexu pro jakýkoli zdroj dat, který může procházet. Minimálně index vyžaduje název a kolekci polí. Jedno z polí by mělo být označeno jako klíč dokumentu, aby bylo možné jednoznačně identifikovat každý dokument. Kromě toho můžete zadat analyzátory jazyka nebo návrhy, pokud chcete automatické dokončování nebo navrhované dotazy.

Pole mají datový typ a atributy. Zaškrtávací políčka v horní části jsou atributy , které řídí způsob použití pole.

  • Klíč je jedinečný identifikátor dokumentu. Vždy je to řetězec a je to povinné. Klíčem může být pouze jedno pole.
  • Načtení znamená, že se obsah polí zobrazí v seznamu výsledků hledání. Zrušením zaškrtnutí tohoto políčka můžete označit jednotlivá pole jako mimo limity pro výsledky hledání, například pro pole použitá pouze ve výrazech filtru.
  • Filtrovatelné, seřaditelné a facetable určují, jestli se pole používají ve struktuře filtru, řazení nebo fasetové navigace.
  • Searchable (Prohledávatelné) znamená, že je pole součástí fulltextové vyhledávání. Řetězce je možné prohledávat. Číselná pole a logická pole jsou často označena jako neprohledávatelné.

Požadavky na úložiště se můžou lišit v důsledku výběru atributu. Například možnost Filtrovatelné vyžaduje více úložiště, ale možnost Načítání ne.

Ve výchozím nastavení průvodce vyhledá ve zdroji dat jedinečné identifikátory jako základ pro klíčové pole. Řetězce jsou přiřazeny jako Retrievable a Searchable. Celá čísla se přiřazují jako Retrievable, Filterable, Sortable a Facetable.

  1. Přijměte výchozí hodnoty.

    Pokud průvodce znovu spustíte znovu s použitím existujícího zdroje dat hotelů, nebude index nakonfigurován s výchozími atributy. Při budoucích importech budete muset atributy vybrat ručně.

  2. Pokračujte na další stránku.

Krok 4 – konfigurace indexeru

V Průvodci importem dat vyberteNázevindexeru> a zadejte název indexeru.

Tento objekt definuje spustitelný proces. Můžete ho nastavit podle plánu opakování, ale prozatím použijte výchozí možnost a spusťte indexer jednou okamžitě.

Vyberte Odeslat a vytvořte a současně spusťte indexer.

Snímek obrazovky s definicí indexeru hotelů v průvodci

Monitorování průběhu

Průvodce by vás měl převést na seznam Indexerů, kde můžete sledovat průběh. Pro samoobslužnou navigaci přejděte na stránku Přehled a vyberte kartu Indexery .

Aktualizace stránky na portálu může trvat několik minut, ale v seznamu by se měl zobrazit nově vytvořený indexer se stavem probíhá nebo úspěch a počet indexovaných dokumentů.

Snímek obrazovky se zprávou o průběhu indexeru v průvodci

Kontrola výsledků

Stránka s přehledem služby obsahuje odkazy na prostředky vytvořené ve službě Azure Cognitive Search. Pokud chcete zobrazit index, který jste právě vytvořili, v seznamu odkazů vyberte Indexy .

Počkejte, až se stránka portálu aktualizuje. Po několika minutách by se měl zobrazit index s počtem dokumentů a velikostí úložiště.

Snímek obrazovky se seznamem Indexy na řídicím panelu služby

V tomto seznamu můžete vybrat ukázkový index hotelů , který jste právě vytvořili, a zobrazit schéma indexu. a volitelně přidejte nová pole.

Na kartě Pole se zobrazí schéma indexu. Pokud píšete dotazy a potřebujete zkontrolovat, jestli je pole filtrovatelné nebo seřaditelné, zobrazí se na této kartě atributy.

Posuňte se do dolní části seznamu a zadejte nové pole. I když můžete vždy vytvořit nové pole, ve většině případů nemůžete změnit existující pole. Existující pole mají ve vyhledávací službě fyzickou reprezentaci, a proto nejsou upravitelná, a to ani v kódu. Pokud chcete zásadním způsobem změnit existující pole, vytvořte nový index a původní vyřazovat.

Snímek obrazovky s ukázkovou definicí indexu v Azure Portal

Kdykoli lze přidat další konstrukce, jako jsou bodovací profily a možnosti CORS.

Pokud chcete jasně pochopit, co můžete a co nemůžete během návrhu indexu upravit, chvíli si prohlédněte možnosti definice indexu. Neaktivní možnosti jsou indikátorem toho, že hodnotu nejde upravit ani odstranit.

Dotazování pomocí Průzkumníka služby Search

Teď máte vyhledávací index, na který se dá dotazovat pomocí Průzkumníka služby Search.

Průzkumník služby Search odesílá volání REST, která odpovídají rozhraní API pro vyhledávání dokumentů. Nástroj podporuje jednoduchou syntaxi dotazů a úplný analyzátor dotazů Lucene.

  1. Na panelu příkazů vyberte Průzkumník služby Search .

    Snímek obrazovky s příkazem Průzkumníka služby Search na panelu příkazů

  2. V části Index zvolte hotels-sample-index.

    Snímek obrazovky se seznamy pro výběr indexů a rozhraní API v Průzkumníku služby Search

  3. Na panelu hledání vložte řetězec dotazu z následujících příkladů a vyberte Hledat.

    Snímek obrazovky s textovým polem řetězce dotazu a vyhledávacím tlačítkem v Průzkumníku služby Search

Spouštění dalších ukázkových dotazů

Všechny dotazy v této části jsou navržené pro Průzkumníka služby Search a ukázkový index Hotels. Výsledky se vrátí jako podrobné dokumenty JSON. Všechna pole označená jako "retrievable" v indexu se můžou zobrazit ve výsledcích. Další informace o dotazech najdete v tématu Dotazování v Azure Cognitive Search.

Dotazy Description
search=spa Jednoduchý fulltextový dotaz s hlavními N výsledky. Parametr search= se používá pro vyhledávání klíčových slov, v tomto případě vrací data hotelů pro ty, které obsahují lázně , v libovolném prohledávatelných polích v dokumentu.
search=beach &$filter=Rating gt 4 Filtrovaný dotaz. V tomto případě je hodnocení větší než 4.
search=spa &$select=HotelName,Description,Tags &$count=true &$top=10 Parametrizovaný dotaz. Symbol & slouží k připojení parametrů vyhledávání, které lze zadat v libovolném pořadí.
$select parametr vrátí podmnožinu polí pro stručnější výsledky hledání.
$count=true parametr vrátí celkový počet všech dokumentů, které odpovídají dotazu.
$top=10 vrátí nejvýše seřazených 10 dokumentů z celkového počtu. Ve výchozím nastavení Azure Cognitive Search vrátí prvních 50 nejlepších shod. Pomocí tohoto parametru můžete tuto částku zvýšit nebo snížit.
search=* &facet=Category &$top=2 Fazetový dotaz, který se používá k vrácení agregovaného počtu dokumentů, které odpovídají zadané hodnotě omezující vlastnosti. Při prázdném nebo nekvalifikovaném hledání jsou reprezentovány všechny dokumenty. V indexu hotelů je pole Kategorie označené jako "facetable".
search=spa &facet=Rating Omezující vlastnost číselných hodnot. Tento dotaz má omezující vlastnost pro hodnocení, v textu vyhledejte "spa". Termín "Hodnocení" lze zadat jako omezující vlastnost, protože pole je v indexu označené jako načístelné, filtrovatelné a facetable a jeho číselné hodnoty (1 až 5) jsou vhodné pro seskupení výsledků podle jednotlivých hodnot.
search=beach &highlight=Description &$select=HotelName, Description, Category, Tags Stiskněte zvýraznění. Termín "pláž" se zvýrazní, jakmile se zobrazí v poli Popis.
search=seatle Následuje
search=seatle~ &queryType=full
Přibližné hledání. Ve výchozím nastavení chybně napsané výrazy dotazu, jako je seatle pro "Seattle", při typickém hledání nevrátí shody. První příklad nevrátí žádné výsledky. Přidání queryType=full vyvolá úplný analyzátor dotazů Lucene, který podporuje ~ operand pro přibližné vyhledávání.
$filter=geo.distance(Location, geography'POINT(-122.12 47.67)') le 5 &search=* &$select=HotelName, Address/City, Address/StateProvince &$count=true Geoprostorové vyhledávání. Ukázkový dotaz vyfiltruje všechny výsledky pro poziční data, kde jsou výsledky méně než 5 kilometrů od daného bodu podle souřadnic zeměpisné šířky a délky (v tomto příkladu se jako bod původu používá Redmond, Washington).

Shrnutí

Tento rychlý start poskytuje rychlý úvod k Azure Cognitive Search používání Azure Portal.

Zjistili jste, jak vytvořit index vyhledávání pomocí průvodce pro Import dat. Vytvořili jste svůj první indexer a naučili jste se základní pracovní postup pro návrh indexu. Další informace o výhodách a omezeních průvodce najdete v průvodci importem dat v Azure Cognitive Search.

Pomocí Průzkumníka služby Search v Azure Portal jste se seznámili se základní syntaxí dotazů prostřednictvím praktických příkladů, které předváděly klíčové funkce, jako jsou filtry, zvýrazňování přístupů, přibližné vyhledávání a geoprostorové vyhledávání.

Vyčištění prostředků

Pokud pracujete s vlastním předplatným, je vhodné vždy na konci projektu zkontrolovat, jestli budete vytvořené prostředky ještě potřebovat. Prostředky, které necháte běžet, vás stojí peníze. Můžete odstraňovat prostředky jednotlivě nebo odstraněním skupiny prostředků odstranit celou sadu prostředků najednou.

Prostředky můžete najít a spravovat na portálu pomocí odkazu Všechny prostředky nebo Skupiny prostředků v levém navigačním podokně.

Pokud používáte bezplatnou službu, nezapomeňte, že limitem jsou tři indexy, indexery a zdroje dat. Pokud chcete zůstat pod limitem, můžete na portálu odstranit jednotlivé položky.

Další kroky

Pomocí průvodce portálem vygenerujte webovou aplikaci připravenou k použití, která běží v prohlížeči. Tohoto průvodce si můžete vyzkoušet na malém indexu, který jste právě vytvořili, nebo můžete použít některou z předdefinovaných ukázkových datových sad pro bohatší vyhledávání.