Vytvoření vlastního modelu analýzy obrázků

Článek
10/17/2024

Důležité

Tato funkce je teď zastaralá. 31. března 2025 se vyřadí vlastní klasifikace obrázků Azure AI 4.0, rozpoznávání vlastních objektů a rozhraní API verze Preview pro rozpoznávání produktů. Po tomto datu se volání rozhraní API do těchto služeb nezdaří.

Pokud chcete zachovat hladký provoz modelů, přejděte na Azure AI Custom Vision, který je teď obecně dostupný. Custom Vision nabízí podobné funkce jako tyto vyřazené funkce.

Image Analysis 4.0 umožňuje trénovat vlastní model pomocí vlastních trénovacích imagí. Ručním popiskem obrázků můžete model vytrénovat tak, aby na obrázky použily vlastní značky (klasifikace obrázků) nebo detekují vlastní objekty (rozpoznávání objektů). Modely analýzy obrázků 4.0 jsou zvláště efektivní při učení s několika snímky , takže můžete získat přesné modely s méně trénovacími daty.

V této příručce se dozvíte, jak vytvořit a vytrénovat vlastní model klasifikace obrázků. Uvádíme několik rozdílů mezi trénováním modelu klasifikace obrázků a modelem detekce objektů.

Poznámka:

Přizpůsobení modelu je k dispozici prostřednictvím rozhraní REST API a sady Vision Studio, ale ne prostřednictvím sad SDK klientského jazyka.

Požadavky

Předplatné Azure. Můžete si ho zdarma vytvořit.
Jakmile budete mít předplatné Azure, vytvořte na webu Azure Portal prostředek Vision, abyste získali klíč a koncový bod. Pokud používáte Vision Studio, musíte prostředek vytvořit v oblasti USA – východ. Po nasazení vyberte Přejít k prostředku. Zkopírujte klíč a koncový bod do dočasného umístění pro pozdější použití.
Prostředek služby Azure Storage. Vytvořte prostředek úložiště.
Sada obrázků, pomocí kterých se má trénovat klasifikační model. Sadu ukázkových obrázků můžete použít na GitHubu. Nebo můžete použít vlastní image. Potřebujete jenom 3 až 5 obrázků na každou třídu.

Poznámka:

Nedoporučujeme používat vlastní modely pro důležitá obchodní prostředí kvůli potenciální vysoké latenci. Když zákazníci trénují vlastní modely v nástroji Vision Studio, patří tyto vlastní modely do prostředku Zpracování obrazu, pod kterým byli trénováni, a zákazník může k těmto modelům volat pomocí rozhraní API pro analýzu obrázků . Při těchto voláních se vlastní model načte do paměti a inicializuje se infrastruktura předpovědi. I když k tomu dojde, zákazníci můžou zaznamenat delší, než očekávanou latenci, aby mohli přijímat výsledky předpovědi.

Vision Studio
REST API

Vytvoření nového vlastního modelu

Začněte tím, že přejdete do nástroje Vision Studio a vyberete kartu Analýza obrázků. Pak vyberte dlaždici Přizpůsobit modely .

Snímek obrazovky s dlaždicí Přizpůsobit modely

Pak se přihlaste pomocí svého účtu Azure a vyberte prostředek Vision. Pokud ho nemáte, můžete si ho vytvořit z této obrazovky.

Snímek obrazovky s výběrem prostředku

Příprava trénovacích obrázků

Musíte nahrát trénovací obrázky do kontejneru Azure Blob Storage. Na webu Azure Portal přejděte k prostředku úložiště a přejděte na kartu Prohlížeče úložiště. Tady můžete vytvořit kontejner objektů blob a nahrát obrázky. Všechny je umístěte do kořenového adresáře kontejneru.

Přidání datové sady

Pokud chcete vytrénovat vlastní model, musíte ho přidružit k datové sadě , kde jako trénovací data zadáte obrázky a jejich popisky. V nástroji Vision Studio vyberte kartu Datové sady a zobrazte datové sady.

Pokud chcete vytvořit novou datovou sadu, vyberte přidat novou datovou sadu. V místním okně zadejte název a vyberte typ datové sady pro váš případ použití. Modely klasifikace obrázků používají popisky obsahu na celý obrázek, zatímco modely rozpoznávání objektů používají popisky objektů na konkrétní umístění na obrázku. Modely rozpoznávání produktů jsou podkategorie modelů rozpoznávání objektů, které jsou optimalizované pro detekci maloobchodních produktů.

Screenshoot of dialog box to Create new dataset.

Pak vyberte kontejner z účtu služby Azure Blob Storage, do kterého jste uložili trénovací image. Zaškrtnutím políčka povolíte nástroji Vision Studio číst a zapisovat do kontejneru úložiště objektů blob. Tento krok je nezbytný k importu označených dat. Vytvořte datovou sadu.

Vytvoření projektu popisků ve službě Azure Machine Learning

K vyjádření informací o označování potřebujete soubor COCO. Snadný způsob, jak vygenerovat soubor COCO, je vytvořit projekt Azure Machine Learning, který se dodává s pracovním postupem označování dat.

Na stránce s podrobnostmi datové sady vyberte Přidat nový projekt popisků dat. Pojmenujte ho a vyberte Vytvořit nový pracovní prostor. Otevře se nová karta webu Azure Portal, kde můžete vytvořit projekt Azure Machine Learning.

Snímek obrazovky s projektem Vytvoření popisků dat ve službě Azure Machine Learning

Po vytvoření projektu Azure Machine Learning se vraťte na kartu Vision Studio a vyberte ho v části Pracovní prostor. Portál Azure Machine Learning se pak otevře na nové kartě prohlížeče.

Vytvoření popisků

Pokud chcete začít popisovat, postupujte podle výzvy přidat třídy popisků a přidejte třídy popisků.

Snímek obrazovky s tlačítkem Pro přidání tříd popisků

Snímek obrazovky s tlačítkem Pro přidání kategorií popisků

Po přidání všech popisků tříd je uložte, vyberte Spustit v projektu a pak v horní části vyberte Popisek dat .

Snímek obrazovky s tlačítkem Start labeling data

Ruční označení trénovacích dat

Zvolte Začít popisování a postupujte podle pokynů k označení všech obrázků. Až budete hotovi, vraťte se v prohlížeči na kartu Vision Studio.

Teď vyberte Přidat soubor COCO a pak vyberte Importovat soubor COCO z projektu Popisování dat Azure ML. Tím se naimportují označená data ze služby Azure Machine Learning.

Vytvořený soubor COCO je teď uložený v kontejneru Azure Storage, který jste propojili s tímto projektem. Teď ho můžete importovat do pracovního postupu přizpůsobení modelu. Vyberte ho z rozevíracího seznamu. Po importu souboru COCO do datové sady je možné datovou sadu použít k trénování modelu.

Poznámka:

Pokud máte připravený soubor COCO, který chcete importovat, přejděte na kartu Datové sady a vyberte Přidat soubory COCO do této datové sady. Můžete přidat konkrétní soubor COCO z účtu úložiště objektů blob nebo importovat z projektu popisků služby Azure Machine Learning.

Microsoft v současné době řeší problém, který způsobuje selhání importu souboru COCO s velkými datovými sadami při zahájení v nástroji Vision Studio. Pokud chcete trénovat pomocí velké datové sady, doporučujeme místo toho použít rozhraní REST API.

Snímek obrazovky s dialogovým oknem Importovat soubor COCO

Informace o souborech COCO

Soubory COCO jsou soubory JSON s konkrétními požadovanými poli: "images", "annotations"a "categories". Ukázkový soubor COCO bude vypadat takto:

{
 "images": [
   {
     "id": 1,
     "width": 500,
     "height": 828,
     "file_name": "0.jpg",
     "absolute_url": "https://blobstorage1.blob.core.windows.net/cpgcontainer/0.jpg"
   },
    {
      "id": 2,
      "width": 754,
      "height": 832,
      "file_name": "1.jpg",
      "absolute_url": "https://blobstorage1.blob.core.windows.net/cpgcontainer/1.jpg"
    },

   ...

  ],
  "annotations": [
    {
      "id": 1,
      "category_id": 7,
      "image_id": 1,
      "area": 0.407,
      "bbox": [
        0.02663142641129032,
        0.40691584277841153,
        0.9524163571731749,
        0.42766634515266866
      ]
    },
    {
      "id": 2,
      "category_id": 9,
      "image_id": 2,
      "area": 0.27,
      "bbox": [
        0.11803319477782331,
        0.41586723392402375,
        0.7765206955096307,
        0.3483334397217212
      ]
    },
    ...

  ],
  "categories": [
    {
      "id": 1,
      "name": "vegall original mixed vegetables"
    },
    {
      "id": 2,
      "name": "Amy's organic soups lentil vegetable"
    },
    {
      "id": 3,
      "name": "Arrowhead 8oz"
    },

    ...

  ]
}

Referenční dokumentace k poli souboru COCO

Pokud generujete vlastní soubor COCO úplně od začátku, ujistěte se, že jsou všechna požadovaná pole vyplněná správnými podrobnostmi. Následující tabulky popisují každé pole v souboru COCO:

"images"

Klíč	Typ	Popis	Povinné?
`id`	integer	Jedinečné ID obrázku od 1	Ano
`width`	integer	Šířka obrázku v pixelech	Ano
`height`	integer	Výška obrázku v pixelech	Ano
`file_name`	string	Jedinečný název obrázku	Ano
`absolute_url` nebo `coco_url`	string	Cesta k obrázku jako absolutní identifikátor URI objektu blob v kontejneru objektů blob. Prostředek Vision musí mít oprávnění ke čtení souborů poznámek a všech odkazovaných souborů obrázků.	Ano

Hodnotu pro absolute_url najdete ve vlastnostech kontejneru objektů blob:

absolutní adresa URL

"poznámky"

Klíč	Typ	Popis	Povinné?
`id`	integer	ID poznámky	Ano
`category_id`	integer	ID kategorie definované v oddílu `categories`	Ano
`image_id`	integer	ID obrázku	Ano
`area`	integer	Hodnota "Width" x 'Height' (třetí a čtvrtá hodnota `bbox`)	No
`bbox`	list[float]	Relativní souřadnice ohraničujícího rámečku (0 až 1) v pořadí 'Vlevo', 'Horní', 'Šířka', 'Výška'	Ano

"categories" (kategorie)

Klíč	Typ	Popis	Povinné?
`id`	integer	Jedinečné ID pro každou kategorii (třída popisku). Ty by se měly vyskytovat v `annotations` části.	Ano
`name`	string	Název kategorie (třída popisku)	Ano

Ověření souboru COCO

Ukázkový kód Pythonu můžete použít ke kontrole formátu souboru COCO.

Trénování vlastního modelu

Pokud chcete začít trénovat model pomocí souboru COCO, přejděte na kartu Vlastní modely a vyberte Přidat nový model. Zadejte název modelu a vyberte Image classification nebo Object detection jako typ modelu.

Snímek obrazovky s dialogovým oknem Pro trénování nového modelu

Vyberte datovou sadu, která je teď přidružená k souboru COCO obsahujícímu informace o označování.

Pak vyberte časový rozpočet a vytrénujte model. U malých příkladů můžete použít 1 hour rozpočet.

Snímek obrazovky s podrobnostmi o trénování ke kontrole

Dokončení trénování může nějakou dobu trvat. Modely analýzy obrázků 4.0 můžou být přesné pouze s malou sadou trénovacích dat, ale trénování trvá déle než předchozí modely.

Vyhodnocení natrénovaného modelu

Po dokončení trénování můžete zobrazit vyhodnocení výkonu modelu. Používají se následující metriky:

Klasifikace obrázků: Průměrná přesnost, Přesnost top 1, Přesnost Top 5
Rozpoznávání objektů: Průměrná přesnost @ 30, Průměrná přesnost @ 50, Průměrná průměrná přesnost @ 75

Pokud při trénování modelu není k dispozici testovací sada, bude hlášený výkon odhadován na základě části trénovací sady. Důrazně doporučujeme použít vyhodnocovací datovou sadu (pomocí stejného procesu jako výše), abyste měli spolehlivý odhad výkonu modelu.

Snímek obrazovky zobrazující výsledky vyhodnocení

Testování vlastního modelu v nástroji Vision Studio

Jakmile vytvoříte vlastní model, můžete ho otestovat výběrem tlačítka Vyzkoušet na obrazovce pro vyhodnocení modelu.

Snímek obrazovky se zkušebním modelem a vyznačeným tlačítkem Vyzkoušet

Tím přejdete na stránku Extrahovat běžné značky ze stránky obrázků . V rozevírací nabídce zvolte vlastní model a nahrajte testovací obrázek.

Snímek obrazovky s výběrem testovacího modelu v nástroji Vision Studio

Výsledky předpovědi se zobrazí ve správném sloupci.

Příprava trénovacích dat

První věcí, kterou musíte udělat, je vytvoření souboru COCO z trénovacích dat. Podívejte se na následující specifikaci.

Informace o souborech COCO

Soubory COCO jsou soubory JSON s konkrétními požadovanými poli: "images", "annotations"a "categories". Ukázkový soubor COCO bude vypadat takto:

{
 "images": [
   {
     "id": 1,
     "width": 500,
     "height": 828,
     "file_name": "0.jpg",
     "absolute_url": "https://blobstorage1.blob.core.windows.net/cpgcontainer/0.jpg"
   },
    {
      "id": 2,
      "width": 754,
      "height": 832,
      "file_name": "1.jpg",
      "absolute_url": "https://blobstorage1.blob.core.windows.net/cpgcontainer/1.jpg"
    },

   ...

  ],
  "annotations": [
    {
      "id": 1,
      "category_id": 7,
      "image_id": 1,
      "area": 0.407,
      "bbox": [
        0.02663142641129032,
        0.40691584277841153,
        0.9524163571731749,
        0.42766634515266866
      ]
    },
    {
      "id": 2,
      "category_id": 9,
      "image_id": 2,
      "area": 0.27,
      "bbox": [
        0.11803319477782331,
        0.41586723392402375,
        0.7765206955096307,
        0.3483334397217212
      ]
    },
    ...

  ],
  "categories": [
    {
      "id": 1,
      "name": "vegall original mixed vegetables"
    },
    {
      "id": 2,
      "name": "Amy's organic soups lentil vegetable"
    },
    {
      "id": 3,
      "name": "Arrowhead 8oz"
    },

    ...

  ]
}

Referenční dokumentace k poli souboru COCO

"images"

Klíč	Typ	Popis	Povinné?
`id`	integer	Jedinečné ID obrázku od 1	Ano
`width`	integer	Šířka obrázku v pixelech	Ano
`height`	integer	Výška obrázku v pixelech	Ano
`file_name`	string	Jedinečný název obrázku	Ano
`absolute_url` nebo `coco_url`	string	Cesta k obrázku jako absolutní identifikátor URI objektu blob v kontejneru objektů blob. Prostředek Vision musí mít oprávnění ke čtení souborů poznámek a všech odkazovaných souborů obrázků.	Ano

Hodnotu pro absolute_url najdete ve vlastnostech kontejneru objektů blob:

absolutní adresa URL

"poznámky"

Klíč	Typ	Popis	Povinné?
`id`	integer	ID poznámky	Ano
`category_id`	integer	ID kategorie definované v oddílu `categories`	Ano
`image_id`	integer	ID obrázku	Ano
`area`	integer	Hodnota "Width" x 'Height' (třetí a čtvrtá hodnota `bbox`)	No
`bbox`	list[float]	Relativní souřadnice ohraničujícího rámečku (0 až 1) v pořadí 'Vlevo', 'Horní', 'Šířka', 'Výška'	Ano

"categories" (kategorie)

Klíč	Typ	Popis	Povinné?
`id`	integer	Jedinečné ID pro každou kategorii (třída popisku). Ty by se měly vyskytovat v `annotations` části.	Ano
`name`	string	Název kategorie (třída popisku)	Ano

Ověření souboru COCO

Ukázkový kód Pythonu můžete použít ke kontrole formátu souboru COCO.

Nahrání do úložiště

Nahrajte soubor COCO do kontejneru úložiště objektů blob, ideálně do stejného kontejneru objektů blob, který obsahuje samotné trénovací image.

Vytvoření trénovací datové sady

Rozhraní datasets/<dataset-name> API umožňuje vytvořit nový objekt datové sady, který odkazuje na trénovací data. Proveďte následující změny příkazu cURL:

Nahraďte <endpoint> koncovým bodem služby Azure AI Vision.
Nahraďte <dataset-name> názvem vaší datové sady.
Nahraďte <subscription-key> klíčem Azure AI Vision.
V textu požadavku nastavte "annotationKind" buď "imageClassification" nebo "imageObjectDetection", v závislosti na vašem projektu.
V textu požadavku nastavte "annotationFileUris" pole na pole řetězců, které zobrazují umístění identifikátoru URI vašich souborů COCO v úložišti objektů blob.

curl.exe -v -X PUT "<endpoint>/computervision/datasets/<dataset-name>?api-version=2023-02-01-preview" -H "Content-Type: application/json" -H "Ocp-Apim-Subscription-Key: <subscription-key>" --data-ascii "
{
'annotationKind':'imageClassification',
'annotationFileUris':['<URI>']
}"

Vytvoření a trénování modelu

Rozhraní models/<model-name> API umožňuje vytvořit nový vlastní model a přidružit ho k existující datové sadě. Spustí se také proces trénování. Proveďte následující změny příkazu cURL:

Nahraďte <endpoint> koncovým bodem služby Azure AI Vision.
Nahraďte <model-name> názvem modelu.
Nahraďte <subscription-key> klíčem Azure AI Vision.
V textu požadavku nastavte "trainingDatasetName" název datové sady z předchozího kroku.
V textu požadavku nastavte "modelKind" buď "Generic-Classifier" nebo "Generic-Detector", v závislosti na vašem projektu.

curl.exe -v -X PUT "<endpoint>/computervision/models/<model-name>?api-version=2023-02-01-preview" -H "Content-Type: application/json" -H "Ocp-Apim-Subscription-Key: <subscription-key>" --data-ascii "
{
'trainingParameters': {
    'trainingDatasetName':'<dataset-name>',
    'timeBudgetInHours':1,
    'modelKind':'Generic-Classifier',
    }
}"

Vyhodnocení výkonu modelu u datové sady

Rozhraní models/<model-name>/evaluations/<eval-name> API vyhodnocuje výkon existujícího modelu. Proveďte následující změny příkazu cURL:

Nahraďte <endpoint> koncovým bodem služby Azure AI Vision.
Nahraďte <model-name> názvem modelu.
Nahraďte <eval-name> názvem, který lze použít k jednoznačné identifikaci vyhodnocení.
Nahraďte <subscription-key> klíčem Azure AI Vision.
V textu požadavku nastavte "testDatasetName" název datové sady, kterou chcete použít k vyhodnocení. Pokud nemáte vyhrazenou datovou sadu, můžete použít stejnou datovou sadu, kterou jste použili k trénování.

curl.exe -v -X PUT "<endpoint>/computervision/models/<model-name>/evaluations/<eval-name>?api-version=2023-02-01-preview" -H "Content-Type: application/json" -H "Ocp-Apim-Subscription-Key: <subscription-key>" --data-ascii "
{
'evaluationParameters':{
    'testDatasetName':'<dataset-name>'
    },
}"

Volání rozhraní API vrátí objekt JSON ModelPerformance , který vypíše skóre modelu v několika kategoriích. Používají se následující metriky:

Klasifikace obrázků: Průměrná přesnost, Přesnost top 1, Přesnost Top 5
Rozpoznávání objektů: Průměrná přesnost @ 30, Průměrná přesnost @ 50, Průměrná průměrná přesnost @ 75

Otestování vlastního modelu na obrázku

Rozhraní imageanalysis:analyze API provede běžné operace analýzy obrázků. Zadáním některých parametrů můžete toto rozhraní API použít k dotazování vlastního modelu namísto předem připravených modelů analýzy obrázků. Proveďte následující změny příkazu cURL:

Nahraďte <endpoint> koncovým bodem služby Azure AI Vision.
Nahraďte <model-name> názvem modelu.
Nahraďte <subscription-key> klíčem Azure AI Vision.
V textu požadavku nastavte "url" adresu URL vzdáleného obrázku, na který chcete model otestovat.

curl.exe -v -X POST "<endpoint>/computervision/imageanalysis:analyze?model-name=<model-name>&api-version=2023-02-01-preview" -H "Content-Type: application/json" -H "Ocp-Apim-Subscription-Key: <subscription-key>" --data-ascii "
{'url':'https://learn.microsoft.com/azure/ai-services/computer-vision/media/quickstarts/presentation.png'
}"

Volání rozhraní API vrátí objekt JSON ImageAnalysisResult , který obsahuje všechny zjištěné značky pro klasifikátor obrázků nebo objekty detektoru objektů s jejich skóre spolehlivosti.

{
  "kind": "imageAnalysisResult",
  "metadata": {
    "height": 900,
    "width": 1260
  },
  "customModelResult": {
    "classifications": [
      {
        "confidence": 0.97970027,
        "label": "hemlock"
      },
      {
        "confidence": 0.020299695,
        "label": "japanese-cherry"
      }
    ],
    "objects": [],
    "imageMetadata": {
      "width": 1260,
      "height": 900
    }
  }
}

V této příručce jste vytvořili a vytrénovali vlastní model klasifikace obrázků pomocí analýzy obrázků. V dalším kroku se dozvíte více o rozhraní API Analyzovat obrázek 4.0, abyste mohli volat vlastní model z aplikace pomocí REST.

Koncepty přizpůsobení modelu
Volání rozhraní API pro analýzu obrázků

Sdílet prostřednictvím

Vytvoření vlastního modelu analýzy obrázků

Požadavky

Vytvoření nového vlastního modelu

Příprava trénovacích obrázků

Přidání datové sady

Vytvoření projektu popisků ve službě Azure Machine Learning

Vytvoření popisků

Ruční označení trénovacích dat

Informace o souborech COCO

Referenční dokumentace k poli souboru COCO

Ověření souboru COCO

Trénování vlastního modelu

Vyhodnocení natrénovaného modelu

Testování vlastního modelu v nástroji Vision Studio

Příprava trénovacích dat

Informace o souborech COCO

Referenční dokumentace k poli souboru COCO

Ověření souboru COCO

Nahrání do úložiště

Vytvoření trénovací datové sady

Vytvoření a trénování modelu

Vyhodnocení výkonu modelu u datové sady

Otestování vlastního modelu na obrázku

Váš názor

Další materiály

Sdílet prostřednictvím

Vytvoření vlastního modelu analýzy obrázků

Požadavky

Vytvoření nového vlastního modelu

Příprava trénovacích obrázků

Přidání datové sady

Vytvoření projektu popisků ve službě Azure Machine Learning

Vytvoření popisků

Ruční označení trénovacích dat

Informace o souborech COCO

Referenční dokumentace k poli souboru COCO

Ověření souboru COCO

Trénování vlastního modelu

Vyhodnocení natrénovaného modelu

Testování vlastního modelu v nástroji Vision Studio

Související obsah

Váš názor

Další materiály