Co je analýza obrázků?

Služba Azure Vision in Foundry Tools Image Analysis Service dokáže z obrázků extrahovat širokou škálu vizuálních funkcí. Může například určit, jestli obrázek obsahuje obsah pro dospělé, najít konkrétní značky nebo objekty nebo najít lidské tváře.

Nejnovější verze image Analysis 4.0, která je nyní obecně dostupná, má nové funkce, jako je synchronní detekce OCR a lidí. Tuto verzi použijte v budoucnu.

Analýzu obrázků můžete použít prostřednictvím sady SDK klientské knihovny nebo voláním rozhraní REST API přímo. Postupujte podle quickstart pro zahájení.

Quickstart

Nebo můžete pomocí nástroje Vision Studio vyzkoušet funkce Analýzy obrázků rychle a snadno v prohlížeči.

Vyzkoušet Vision Studio

Tato dokumentace obsahuje následující typy článků:

Rychlé začátky jsou podrobné pokyny, které umožňují volat službu a získat výsledky během krátké doby.
Návody obsahují pokyny pro používání služby konkrétnějšími nebo přizpůsobenými způsoby.
Koncepční články poskytují podrobné vysvětlení funkcí a funkcí služby.

Pokud chcete strukturovanější přístup, postupujte podle školicího modulu pro analýzu obrázků.

Analýza obrázků pomocí služby Azure Vision

Verze obrázkové analýzy

Important

Vyberte verzi rozhraní API pro analýzu obrázků, která nejlépe vyhovuje vašim požadavkům.

Version	Dostupné funkce	Recommendation
verze 4.0	Čtení textu, popisky, husté popisky, štítky, rozpoznávání objektů, lidé, inteligentní výřez	Lepší modely; pokud podporuje váš případ použití, použijte verzi 4.0.
verze 3.2	Tagy, Objekty, Popisy, Značky, Tváře, Typ obrázku, Barevné schéma, Orientační body, Celebrity, Obsah pro dospělé, Inteligentní oříznutí	Širší rozsah funkcí; pokud váš případ použití ještě není ve verzi 4.0 podporovaný, použijte verzi 3.2.

Pokud podporuje váš případ použití, doporučujeme použít rozhraní API pro analýzu obrázků 4.0. Pokud váš případ použití ještě nepodporuje verze 4.0, použijte verzi 3.2.

Pokud chcete popisovat obrázky a váš Vision zdroj je mimo podporované oblasti Azure, budete také muset použít verzi 3.2. Funkce titulkování obrázků ve službě Image Analysis 4.0 se podporuje jenom v určitých oblastech Azure. Titulky obrázků ve verzi 3.2 jsou k dispozici ve všech oblastech Azure Vision. Viz Dostupnost oblastí.

Analýza obrázků

Můžete analyzovat obrázky, abyste získali přehled o jejich vizuálních funkcích a vlastnostech. Rozhraní API pro analýzu obrázků poskytuje všechny funkce v této tabulce. Začněte podle rychlého úvodu.

Name	Description	Stránka konceptů
Přizpůsobení modelu (jenom verze 4.0 Preview) (zastaralé)	Vytváření a trénování vlastních modelů pro klasifikaci obrázků nebo rozpoznávání objektů Přineste si vlastní image, označte je vlastními značkami a Analýza obrázků trénuje model přizpůsobený vašemu případu použití.	Přizpůsobení modelu
Čtení textu z obrázků (pouze v4.0)	Verze 4.0 Preview analýzy obrázků nabízí možnost extrahovat čitelný text z obrázků. V porovnání s asynchronním rozhraním API pro čtení Počítačového zpracování obrazu 3.2 nabízí nová verze známý modul Read OCR ve sjednoceném synchronním rozhraní API se zlepšeným výkonem, které umožňuje snadno získat OCR spolu s dalšími přehledy jedním voláním rozhraní API.	OCR pro image
Detekce lidí na obrázcích (pouze v4.0)	Verze 4.0 analýzy obrázků nabízí možnost detekovat osoby, které se zobrazují na obrázcích. Rozhraní API vrátí souřadnice ohraničujícího rámečku každé detekované osoby spolu s mírou jistoty.	Detekce osob
Generování titulků obrázků	Pomocí úplných vět vygenerujte titulek obrázku v jazyce čitelným pro člověka. Počítačové zpracování obrazu algoritmy generují titulky na základě objektů identifikovaných na obrázku. Model titulkování obrázků verze 4.0 je pokročilejší implementace a funguje s širší škálou vstupních obrázků. Je k dispozici pouze v určitých geografických oblastech. Viz Dostupnost oblastí. Verze 4.0 také umožňuje používat zhuštěné titulky, které generují podrobné titulky pro jednotlivé objekty nalezené na obrázku. Rozhraní API vrátí souřadnice ohraničujícího rámečku (v pixelech) každého objektu nalezeného na obrázku a titulek. Pomocí této funkce můžete generovat popisy samostatných částí obrázku.	Generování titulků obrázků (v3.2) (v4.0)
Detekce objektů	Detekce objektů se podobá označování, ale rozhraní API vrátí souřadnice ohraničujícího rámečku pro každou použitou značku. Pokud například obrázek obsahuje psa, kočku a osobu, zobrazí operace Detect tyto objekty společně s jejich souřadnicemi na obrázku. Pomocí této funkce můžete zpracovat další vztahy mezi objekty na obrázku. Také vám to umožní zjistit, jestli je na obrázku více výskytů stejného tagu.	Detekce objektů (v3.2) (v4.0)
Označování vizuálních vlastností	Identifikujte a označte vizuální funkce na obrázku ze sady tisíců rozpoznatelných objektů, živých věcí, scenérií a akcí. Pokud jsou značky nejednoznačné nebo nejsou obecně známé, odpověď rozhraní API poskytuje nápovědu k objasnění kontextu značky. Označování se neomezuje na hlavní předmět, například postavu v popředí, ale zahrnuje také prostředí (interiér nebo exteriér), nábytek, nástroje, rostliny, zvířata, příslušenství, pomůcky atd.	Označení vizuálních vlastností (v3.2) (v4.0)
Získání oblasti zájmu / inteligentní oříznutí	Analyzujte obsah obrázku, abyste vrátili souřadnice oblasti zájmu , která odpovídá zadanému poměru stran. Počítačové zpracování obrazu vrátí souřadnice ohraničujícího rámečku oblasti, takže volající aplikace může podle potřeby upravit původní obrázek. Model inteligentního oříznutí verze 4.0 je pokročilejší implementace a funguje s širší škálou vstupních obrázků. Je k dispozici pouze v určitých geografických oblastech. Viz Dostupnost oblastí.	Vygenerování miniatury (v3.2) (v4.0 Preview)
Rozpoznání značek (pouze v3.2)	Identifikujte komerční značky na obrázcích nebo videích z databáze tisíců globálních log. Tuto funkci můžete použít například ke zjištění, které značky jsou nejoblíbenější na sociálních sítích nebo nejrozšířenější v umístění mediálních produktů.	Detekce značek
Kategorizujte obrázek (pouze v3.2)	Identifikovat a kategorizovat celý obrázek s využitím taxonomie kategorií s hierarchickými úrovněmi rodič/dítě. Kategorie je možné používat samostatně nebo s našimi novými modely označování. V současné době je jediným podporovaným jazykem pro označování a kategorizaci obrázků angličtina.	Kategorizace obrázku
Rozpoznávání tváří (pouze v3.2)	Rozpoznává tváře na obrázku a poskytuje informace o jednotlivých rozpoznaných tvářích. Azure Vision vrátí souřadnice, obdélník, pohlaví a věk pro každou detekovanou tvář. K těmto účelům můžete také použít vyhrazené rozhraní API pro rozpoznávání tváře. Poskytuje podrobnější analýzu, jako je identifikace obličeje a detekce pozice.	Rozpoznávání tváří
Detekce typů obrázků (pouze verze 3.2)	Rozpoznává charakteristiky obrázku, například jestli jde o perokresbu nebo s jakou pravděpodobností je obrázek klipart.	Rozpoznávání typů obrázků
Zjištění obsahu specifického pro doménu (pouze verze 3.2)	S využitím doménových modelů rozpoznává a identifikuje obsah obrázku specifický pro doménu, například celebrity a památky. Pokud například obrázek obsahuje lidi, azure Vision může pomocí doménového modelu pro celebrity určit, jestli jsou lidé na obrázku známí celebritami.	Rozpoznávání obsahu specifického doménu
Zjištění barevného schématu (pouze v3.2)	Analyzuje použité barvy na obrázku. Azure Vision dokáže určit, jestli je obrázek černobílý nebo barevný a u barevných obrázků identifikuje dominantní a zvýrazněné barvy.	Rozpoznávání barevného schématu
Moderování obsahu v obrázcích (pouze v3.2)	Pomocí služby Azure Vision můžete detekovat obsah pro dospělé na obrázku a vrátit skóre spolehlivosti pro různé klasifikace. Prahovou hodnotu pro obsah s příznakem lze nastavit na posuvné škále, aby vyhovovala vašim preferencím.	Zjištění obsahu pro dospělé

Rozpoznávání produktů (jenom verze 4.0 Preview) (zastaralé)

Important

Tato funkce je teď vyřazená. Dne 31. března 2025 bylo ukončeno testovací rozhraní API pro vlastní klasifikaci obrázků, detekci vlastních objektů a rozpoznávání produktů v rámci verze Azure AI Image Analysis 4.0. Volání rozhraní API pro tyto služby selžou.

Přechod na Azure AI Custom Vision, který je obecně dostupný. Custom Vision nabízí podobné funkce jako tyto vyřazené funkce.

Rozhraní API pro rozpoznávání produktů umožňují analyzovat fotky polic v maloobchodě. Můžete zjistit přítomnost nebo nepřítomnost výrobků a získat souřadnice ohraničujícího rámečku. Můžete ho použít v kombinaci s přizpůsobením modelu a vytrénovat model tak, aby identifikoval vaše konkrétní produkty. Výsledky rozpoznávání produktů můžete také porovnat s dokumentem planogramu obchodu.

Rozpoznávání produktů

Vícemodální vkládání (pouze v4.0)

API pro multimodální vkládání umožňují vektorizaci obrázků a textových dotazů. Převádějí obrázky na souřadnice v multidimenzionálním vektorovém prostoru. Pak můžete převést příchozí textové dotazy na vektory a shodovat obrázky s textem na základě sémantické blízkosti. Tato funkce umožňuje prohledávat sadu obrázků pomocí textu, aniž byste museli používat značky obrázků nebo jiná metadata. Sémantická blízkost často vede k lepším výsledkům hledání.

Rozhraní 2024-02-01 API obsahuje vícejazyčný model, který podporuje vyhledávání textu ve 102 jazycích. Původní anglický model je stále dostupný, ale nemůžete ho kombinovat s novým modelem ve stejném indexu vyhledávání. Pokud jste vektorizovali text a obrázky pomocí anglického modelu, nebudou tyto vektory kompatibilní s vícejazyčným textem a vektory obrázků.

Tato rozhraní API jsou dostupná pouze v určitých geografických oblastech. Viz Dostupnost oblastí.

Vícemodální vkládání

Odebrání pozadí (jenom verze 4.0 Preview)

Important

Tato funkce je teď vyřazená. 31. března 2025 se vyřadilo rozhraní API segmentů Azure AI Analysis 4.0 a služba pro odebrání pozadí. Volání rozhraní API pro tyto služby selžou.

Funkce segmentace opensourcového modelu Florencie 2 může vyhovovat vašim potřebám. Vrátí alfa mapu označující rozdíl mezi popředím a pozadím, ale původní obrázek neupravuje, aby se odebralo pozadí. Nainstalujte model Florence 2 a vyzkoušejte jeho funkci regionu k segmentaci.

Pokud chcete odebrat plnohodnotné pozadí, zvažte nástroj třetí strany, jako je BiRefNet.

Limity služeb

Analýza obrázků funguje jen u obrázků, které vyhovují následujícím požadavkům:

Obrázek musí být ve formátu JPEG, PNG, GIF, BMP, WEBP, ICO, TIFF nebo MPO.
Velikost souboru obrázku musí být menší než 20 megabajtů (MB)
Rozměry obrázku musí být větší než 50 x 50 pixelů a menší než 16 000 x 16 000 pixelů.

Tip

Požadavky na vstup pro vícemodální vkládání se liší a jsou uvedeny v multimodálních vkládáních.

Podpora jazyků

Různé funkce analýzy obrázků jsou dostupné v různých jazycích. Podívejte se na stránku podpory jazyka .

Dostupnost v regionu

Pokud chcete používat rozhraní API pro analýzu obrázků, musíte vytvořit prostředek Azure Vision in Foundry Tools v podporované oblasti. Funkce Analýzy obrázků jsou k dispozici v následujících oblastech:

Region	Analýza obrázků (minus 4.0 Titulky)	Analýza obrázků (včetně titulků verze 4.0)	Rozpoznávání produktů	Vícemodální vkládání
USA – východ	✅	✅	✅	✅
USA – západ	✅	✅		✅
USA – západ 2	✅		✅	✅
Francie – střed	✅	✅		✅
Severní Evropa	✅	✅		✅
Západní Evropa	✅	✅		✅
Švédsko – střed	✅			✅
Švýcarsko – sever	✅			✅
Austrálie – východ	✅			✅
Jihovýchodní Asie	✅	✅		✅
Východní Asie	✅	✅
Korea – střed	✅	✅		✅
Japonsko – východ	✅			✅

Ochrana osobních údajů a zabezpečení dat

Stejně jako u všech nástrojů Foundry by vývojáři, kteří používají službu Azure Vision, měli vědět o zásadách Microsoftu na zákaznických datech. Další informace najdete na stránce Nástroje Foundry v Centru zabezpečení Microsoftu.

Další kroky

Začněte se službou Image Analysis podle úvodní příručky k preferovanému vývojovému jazyku a verzi rozhraní API:

Váš názor

Byla tato stránka užitečná?

Last updated on 2025-09-26

Sdílet prostřednictvím

Co je analýza obrázků?

Verze obrázkové analýzy

Analýza obrázků

Rozpoznávání produktů (jenom verze 4.0 Preview) (zastaralé)

Vícemodální vkládání (pouze v4.0)

Odebrání pozadí (jenom verze 4.0 Preview)

Limity služeb

Požadavky na vstup

Podpora jazyků

Dostupnost v regionu

Ochrana osobních údajů a zabezpečení dat

Další kroky

Váš názor

Další materiály