Rychlý start: Vytvoření modelu klasifikace obrázků pomocí portálu Custom Vision

V tomto rychlém startu se dozvíte, jak pomocí webového portálu Custom Vision vytvořit model klasifikace obrázků. Jakmile vytvoříte model, můžete ho otestovat pomocí nových imagí a nakonec ho integrovat do vlastní aplikace pro rozpoznávání obrázků.

Pokud ještě nemáte předplatné Azure, vytvořte si napřed bezplatný účet.

Požadavky

Vytváření prostředků Custom Vision

Pokud chcete použít službu Custom Vision, budete muset v Azure vytvořit prostředky Custom Vision trénování a predikce. Uděláte to tak, že v Azure Portal vyplníte okno dialogového okna na stránce Vytvořit Custom Vision a vytvoříte prostředek trénování a predikce.

Vytvoření nového projektu

Ve webovém prohlížeči přejděte na webovou stránku Custom Vision a vyberte Přihlásit se. Přihlaste se pomocí stejného účtu, který jste použili k přihlášení k Azure Portal.

Image of the sign-in page

  1. Pokud chcete vytvořit první projekt, vyberte Nový Project. Zobrazí se dialogové okno Vytvořit nový projekt .

    The new project dialog box has fields for name, description, and domains.

  2. Zadejte název a popis projektu. Pak vyberte skupinu prostředků. Pokud je váš přihlášený účet přidružený k účtu Azure, zobrazí se v rozevíracím seznamu Skupina prostředků všechny skupiny prostředků Azure, které zahrnují prostředek služby Custom Vision.

    Poznámka

    Pokud není k dispozici žádná skupina prostředků, ověřte, že jste se přihlásili k customvision.ai se stejným účtem, jako jste použili k přihlášení k Azure Portal. Zkontrolujte také, že jste na webovém portálu Custom Vision vybrali stejný adresář jako adresář v Azure Portal, kde se nacházejí vaše Custom Vision prostředky. Na obou webech můžete vybrat adresář z rozevírací nabídky účtu v pravém horním rohu obrazovky.

  3. Vyberte klasifikaci pod typy Project. Potom v části Typy klasifikace zvolte v závislosti na vašem případu použití možnost Multilabel nebo Multiclass. Klasifikace multilabelu použije na obrázek libovolný počet značek (nula nebo více), zatímco klasifikace s více třídami seřadí obrázky do jedné kategorie (každý obrázek, který odešlete, se seřadí na nejpravděpodobnější značku). Typ klasifikace budete moct později změnit, pokud chcete.

  4. Dále vyberte jednu z dostupných domén. Každá doména optimalizuje model pro konkrétní typy imagí, jak je popsáno v následující tabulce. Pokud chcete, můžete doménu později změnit.

    Domain (Doména) Účel
    Obecné Optimalizováno pro širokou škálu úkolů klasifikace obrázků. Pokud není žádná z ostatních domén vhodná nebo si nejste jisti, kterou doménu si vybrat, vyberte obecnou doménu.
    Potravin Optimalizováno pro fotografie jídel, jak byste je viděli v restauraci menu. Pokud chcete klasifikovat fotografie jednotlivých ovoce nebo zeleniny, použijte doménu Potravina.
    Orientační body tváře Optimalizováno pro rozpoznatelné orientační body, přírodní i umělé. Tato doména funguje nejlépe, když je orientační bod v fotografii jasně viditelný. Tato doména funguje i v případě, že je orientační bod mírně obstrukován lidmi před ním.
    Maloobchod Optimalizováno pro obrázky, které jsou nalezeny v nákupním katalogu nebo na webu pro nákupy. Pokud chcete mít vysokou přesnost klasifikovat mezi šaty, kalhotami a košilemi, použijte tuto doménu.
    Kompaktní domény Optimalizováno pro omezení klasifikace v reálném čase na mobilních zařízeních. Modely vygenerované kompaktními doménami je možné exportovat a spouštět místně.
  5. Nakonec vyberte Vytvořit projekt.

Volba trénovacích obrázků

Jako minimum doporučujeme použít alespoň 30 obrázků na značku v počáteční trénovací sadě. Po vytrénování modelu budete také chtít shromáždit několik dalších obrázků k otestování modelu.

K efektivnímu trénování modelu používejte obrázky s vizuální škálou. Vyberte obrázky, které se liší podle:

  • úhel kamery
  • Osvětlení
  • pozadí
  • vizuální styl
  • individuální/seskupené předměty
  • size
  • typ

Kromě toho se ujistěte, že všechny trénovací obrázky splňují následující kritéria:

  • formát .jpg, .png, .bmp nebo .gif
  • Velikost maximálně 6 MB (4 MB pro obrázky předpovědí)
  • maximálně 256 pixelů na nejkratším okraji; všechny image, které jsou kratší, se automaticky škálují službou Custom Vision Service.

Nahrávání a označování obrázků

V této části nahrajete a ručně označíte obrázky, které vám pomůžou vytrénovat klasifikátor.

  1. Pokud chcete přidat obrázky, vyberte Přidat obrázky a pak vyberte Procházet místní soubory. Výběrem možnosti Otevřít přejdete na označování. Výběr značky se použije pro celou skupinu obrázků, které jste vybrali k nahrání, takže je jednodušší nahrát obrázky do samostatných skupin podle použitých značek. Značky jednotlivých obrázků můžete změnit i po jejich nahrání.

    The add images control is shown in the upper left, and as a button at bottom center.

  2. Pokud chcete vytvořit značku, zadejte text do pole Moje značky a stiskněte Enter. Pokud značka již existuje, zobrazí se v rozevírací nabídce. V projektu s více značkami můžete k obrázkům přidat více než jednu značku, ale v projektu s více třídami můžete přidat jenom jednu. K dokončení nahrávání obrázků použijte tlačítko Upload [číslo] souborů.

    Image of the tag and upload page

  3. Po nahrání obrázků vyberte Hotovo .

    The progress bar shows all tasks completed.

Pokud chcete nahrát další sadu obrázků, vraťte se do horní části této části a opakujte kroky.

Trénování klasifikátoru

Chcete-li vytrénovat klasifikátor, vyberte tlačítko Trénovat. Klasifikátor používá všechny aktuální obrázky k vytvoření modelu, který identifikuje vizuální vlastnosti každé značky. Tento proces může trvat několik minut.

The train button in the top right of the web page's header toolbar

Proces trénování by měl trvat jen několik minut. Během této doby se na kartě Výkon zobrazí informace o procesu trénování.

The browser window with a training dialog in the main section

Vyhodnocení klasifikátoru

Po dokončení trénování se odhaduje a zobrazí výkon modelu. Služba Custom Vision používá obrázky, které jste odeslali pro trénování k výpočtu přesnosti a úplnosti. Přesnost a úplnost jsou dvě různá měření účinnosti klasifikátoru:

  • Přesnost označuje zlomek identifikovaných klasifikací, které byly správné. Pokud například model identifikoval 100 obrázků jako psy a 99 z nich byly ve skutečnosti psi, přesnost by byla 99 %.
  • Úplnost označuje zlomek skutečných klasifikací, které byly správně identifikovány. Pokud by například existovalo 100 obrázků jablek a model identifikovaný jako jablka 80, bude úplnost 80 %.

The training results show the overall precision and recall, and the precision and recall for each tag in the classifier.

Probability threshold

Všimněte si posuvníku Prahová hodnota pravděpodobnosti v levém podokně karty Výkon . Jedná se o úroveň spolehlivosti, kterou musí mít predikce, aby byla považována za správnou (pro účely výpočtu přesnosti a úplnosti).

Při interpretaci volání predikce s vysokou prahovou hodnotou pravděpodobnosti mají tendenci vracet výsledky s vysokou přesností na úkor úplnosti – zjištěné klasifikace jsou správné, ale mnoho z nich zůstává nedetekované. Prahová hodnota nízké pravděpodobnosti je opačná – většina skutečných klasifikací se detekuje, ale v této sadě existuje více falešně pozitivních výsledků. S ohledem na to byste měli nastavit prahovou hodnotu pravděpodobnosti podle konkrétních potřeb projektu. Později, když na straně klienta dostáváte výsledky predikce, měli byste použít stejnou prahovou hodnotu pravděpodobnosti, jakou jste zde použili.

Správa iterací trénování

Pokaždé, když vytrénujete klasifikátor, vytvoříte novou iteraci s aktualizovanými metrikami výkonu. Všechny iterace můžete zobrazit v levém podokně karty Výkon . Najdete také tlačítko Odstranit , které můžete použít k odstranění iterace, pokud je zastaralé. Když odstraníte iteraci, odstraníte všechny obrázky, které jsou k ní jednoznačně přidružené.

Informace o přístupu k natrénovaným modelům najdete v tématu Použití modelu s rozhraním API pro predikce .

Další kroky

V tomto rychlém startu jste zjistili, jak vytvořit a trénovat model klasifikace obrázků pomocí webového portálu Custom Vision. V dalším kroku získáte další informace o iterativním procesu vylepšování modelu.