Rychlý start: Hledání obrázků pomocí Průzkumníka služby Search na webu Azure Portal

Článek
07/10/2024

Důležité

Vektory obrázků jsou podporovány ve stabilních verzích rozhraní API, ale průvodce a vektorizátory jsou ve verzi Preview v rámci doplňkových podmínek použití. Ve výchozím nastavení cílí průvodce na rozhraní REST API verze 2024-05-01-Preview.

V tomto rychlém startu se dozvíte, jak začít s vyhledáváním obrázků pomocí Průvodce importem a vektorizací dat na webu Azure Portal. Ukazuje také, jak pomocí Průzkumníka služby Search spouštět dotazy založené na imagích.

Ukázková data se skládají ze souborů obrázků v úložišti azure-search-sample-data , ale můžete použít různé obrázky a přesto postupovat podle návodu.

Požadavky

Předplatné Azure. Vytvořte si ho zdarma.
Účet služeb Azure AI s více službami, který se používá k vektorizaci obrázků a optickému rozpoznávání znaků (OCR). Účet musí být v oblasti, která poskytuje multimodální vkládání ve službě Azure AI Vision.

V současné době jsou způsobilé oblasti: ŠvédskoCentral, EastUS, NorthEurope, WestEurope, WestUS, SoutheastAsia, KoreaCentral, FranceCentral, AustraliaEast, WestUS2, SwitzerlandNorth, JapanEast. V dokumentaci najdete aktualizovaný seznam.
Azure AI Search pro indexování a dotazy Může být na libovolné úrovni, ale musí být ve stejné oblasti jako služby Azure AI.

Úroveň služby určuje, kolik objektů blob můžete indexovat. K vytvoření tohoto názorného postupu jsme použili úroveň Free a omezili jsme obsah na 10 souborů JPG.
Azure Storage pro ukládání souborů obrázků jako objektů blob. Použijte Azure Blob Storage, účet standardního výkonu (pro obecné účely verze 2). Úrovně přístupu můžou být horké, studené a studené.

Nepoužívejte Azure Data Lake Storage Gen2 (účet úložiště s hierarchickým oborem názvů). Tato verze průvodce nepodporuje Data Lake Storage Gen2.

Všechny předchozí prostředky musí mít povolený veřejný přístup, aby k nim měly uzly portálu přístup. Jinak průvodce selže. Po spuštění průvodce můžete pro zabezpečení povolit brány firewall a privátní koncové body. Další informace naleznete v tématu Zabezpečené připojení v průvodcích importem.

Pokud už existují privátní koncové body a nemůžete je zakázat, je alternativní možností spuštění příslušného kompletního toku ze skriptu nebo programu na virtuálním počítači. Virtuální počítač musí být ve stejné virtuální síti jako privátní koncový bod. Tady je ukázka kódu Pythonu pro integrovanou vektorizaci. Stejné úložiště GitHub obsahuje ukázky v jiných programovacích jazycích.

Bezplatná vyhledávací služba podporuje řízení přístupu na základě role u připojení ke službě Azure AI Search, ale nepodporuje spravované identity u odchozích připojení ke službě Azure Storage nebo Azure AI Vision. Tato úroveň podpory znamená, že pro připojení mezi bezplatnou vyhledávací službou a dalšími službami Azure musíte použít ověřování založené na klíči. Pro připojení, která jsou bezpečnější:

Použijte úroveň Basic nebo vyšší.
Nakonfigurujte spravovanou identitu a přiřazení rolí tak, aby přijímaly žádosti z Azure AI Search v jiných službách Azure.

Kontrola místa

Pokud začínáte s bezplatnou službou, jste omezeni na tři indexy, tři zdroje dat, tři sady dovedností a tři indexery. Než začnete, ujistěte se, že máte místo pro další položky. Tento rychlý start vytvoří jeden z každého objektu.

Příprava ukázkových dat

Stáhněte složku obrázku bez lomítka do místní složky nebo vyhledejte vlastní obrázky. V bezplatné vyhledávací službě ponechte soubory obrázků pod 20, aby zůstaly v rámci bezplatné kvóty pro zpracování rozšiřování.
Přihlaste se k webu Azure Portal pomocí svého účtu Azure a přejděte ke svému účtu Azure Storage.
V levém podokně v části Úložiště dat vyberte Kontejnery.
Vytvořte nový kontejner a pak obrázky nahrajte.

Spuštění průvodce

Pokud je vaše vyhledávací služba a služba Azure AI ve stejné podporované oblasti a tenantovi a pokud váš kontejner objektů blob služby Azure Storage používá výchozí konfiguraci, jste připraveni spustit průvodce.

Přihlaste se k webu Azure Portal pomocí svého účtu Azure a přejděte na Search Azure AI.
Na stránce Přehled vyberte Importovat a vektorizovat data.

Připojení k datům

Dalším krokem je připojení ke zdroji dat, který poskytuje obrázky.

Na stránce Nastavení datového připojení vyberte Azure Blob Storage.
Zadejte předplatné Azure.
Pro Azure Storage vyberte účet a kontejner, který data poskytuje. Pro zbývající pole použijte výchozí hodnoty.
Vyberte Další.

Vektorizace textu

Pokud nezpracovaný obsah obsahuje text nebo pokud sada dovedností vytvoří text, průvodce zavolá model pro vložení textu, který vygeneruje vektory pro daný obsah. V tomto cvičení se text vytvoří z dovednosti OCR, kterou přidáte v dalším kroku.

Azure AI Vision poskytuje vkládání textu, takže tento prostředek použijte pro vektorizaci textu.

Na stránce Vektorizace textu vyberte vektorizaci AI Vision. Pokud není k dispozici, ujistěte se, že azure AI Search a váš účet Azure AI multiservice jsou společně v oblasti, která podporuje multimodální rozhraní API služby AI Vision.
Vyberte Další.

Vektorizace a rozšiřování obrázků

K vygenerování vektorové reprezentace souborů obrázků použijte Azure AI Vision.

V tomto kroku můžete také použít AI k extrakci textu z obrázků. Průvodce používá službu OCR ze služeb Azure AI k rozpoznávání textu v souborech obrázků.

Při přidání OCR do pracovního postupu se v indexu zobrazí dva další výstupy:

Pole chunk se naplní řetězcem vygenerovaným OCR libovolného textu nalezeného na obrázku.
Pole text_vector se vyplní vložením, které představuje chunk řetězec.

Zahrnutí prostého textu do chunk pole je užitečné, pokud chcete použít funkce relevance, které pracují s řetězci, jako jsou sémantické řazení a bodovací profily.

Na stránce Vectorize your images (Vektorizovat obrázky) zaškrtněte políčko Vectorize images (Vektorizovat obrázky) a pak vyberte AI Vision vectorization (Vektorizace obrazu).
Vyberte Použít stejnou službu AI vybranou pro vektorizaci textu.
V části rozšiřování vyberte Extrahovat text z obrázků a použít stejnou službu AI vybranou pro vektorizaci obrázků.
Vyberte Další.

Plánování indexování

Na stránce Upřesnit nastavení v části Naplánovat indexování zadejte plán spuštění indexeru. Pro toto cvičení doporučujeme jednou . U zdrojů dat, kde jsou podkladová data nestálá, můžete naplánovat indexování, aby se změny vybraly.
Vyberte Další.

Dokončení průvodce

Na stránce Kontrola konfigurace zadejte předponu pro objekty, které průvodce vytvoří. Běžná předpona vám pomůže udržet si přehled.
Vyberte Vytvořit.

Po dokončení konfigurace průvodce vytvoří následující objekty:

Indexer, který řídí kanál indexování.
Připojení ke zdroji dat ke službě Blob Storage
Index s vektorovými poli, textovými poli, vektorizátory, vektorovými profily a vektorovými algoritmy. Během pracovního postupu průvodce nelze změnit výchozí index. Indexy odpovídají rozhraní REST API verze 2024-05-01-preview.
Sada dovedností s následujícími pěti dovednostmi:
- Dovednost OCR rozpoznává text v souborech obrázků.
- Dovednost sloučení textu sjednocuje různé výstupy zpracování OCR.
- Dovednost Rozdělení textu přidává datové bloky. Tato dovednost je integrovaná do pracovního postupu průvodce.
- Dovednosti s vícemodálními vkládáními ve službě Azure AI Vision se používají k vektorizaci textu vygenerovaného z OCR.
- Schopnost multimodálních vkládání ve službě Azure AI Vision se znovu volá k vektorizaci obrázků.

Kontrola výsledků

Průzkumník služby Search přijímá jako vstupy dotazů text, vektory a obrázky. Obrázek můžete přetáhnout nebo vybrat do vyhledávací oblasti. Průzkumník služby Search vektorizuje váš obrázek a odešle vektor jako vstup dotazu do vyhledávacího webu. Vektorizace obrázků předpokládá, že váš index má definici vektorizátoru, která importuje a vektorizuje data na základě vstupů modelu vložení.

Na webu Azure Portal přejděte do indexů správy>vyhledávání a vyberte index, který jste vytvořili. Průzkumník služby Search je první karta.
V nabídce Zobrazení vyberte Zobrazení obrázku.
Přetáhněte obrázek z místní složky, která obsahuje ukázkové soubory obrázků. Nebo otevřete prohlížeč souborů a vyberte místní soubor obrázku.
Výběrem možnosti Hledat spusťte dotaz.

Nejvyšší shoda by měla být obrázek, který jste hledali. Vzhledem k tomu, že se vektorové vyhledávání shoduje s podobnými vektory, vrátí vyhledávací modul libovolný dokument, který je dostatečně podobný vstupu dotazu, až do k počtu výsledků. Pro pokročilejší dotazy, které zahrnují ladění relevance, můžete přepnout do zobrazení JSON.
Zkuste porovnat výsledky hledání pomocí dalších možností dotazu:
- Skryjte vektory pro čitelnější výsledky (doporučeno).
- Vyberte vektorové pole, na které chcete dotazovat. Výchozí hodnota je textové vektory, ale můžete určit vektor obrázku, který se má vyloučit z provádění dotazu.

Vyčištění

Tato ukázka používá fakturovatelné prostředky Azure. Pokud už prostředky nepotřebujete, odstraňte je z předplatného, abyste se vyhnuli poplatkům.

Další krok

V tomto rychlém startu jste se seznámili s průvodcem importem a vektorizací dat , který vytvoří všechny potřebné objekty pro vyhledávání obrázků. Pokud chcete podrobně prozkoumat jednotlivé kroky, vyzkoušejte integrovaný vektorizační vzorek.

Sdílet prostřednictvím