Migrieren eines Custom Vision-Projekts zur Bildanalyse 4.0 Vorschau

Artikel
01/19/2024

Sie können ein vorhandenes Azure KI Custom Vision-Projekt zum neuen Bildanalyse 4.0-System migrieren. Custom Vision ist ein Modellanpassungsdienst, der vor der Bildanalyse 4.0 existierte.

In diesem Leitfaden wird Python-Code verwendet, um alle Trainingsdaten aus einem vorhandenen Custom Vision-Projekt (Bilder und deren Bezeichnungsdaten) zu entnehmen und in eine COCO-Datei zu konvertieren. Anschließend können Sie die COCO-Datei in Vision Studio importieren, um ein benutzerdefiniertes Bildanalysemodell zu trainieren. Lesen Sie Erstellen und Trainieren eines benutzerdefinierten Modells, und wechseln Sie zum Abschnitt über das Importieren einer COCO-Datei – Sie können der Anleitung von dort bis zum Ende folgen.

Voraussetzungen

Azure-Abonnement: Kostenloses Azure-Konto
Python 3.x
Eine Custom Vision-Ressource, in der ein vorhandenes Projekt gespeichert ist.
Eine Azure Storage-Ressource – Erstellen Sie eine

Jupyter Notebook
Python

Dieses Notebook exportiert Ihre Bilddaten und Anmerkungen aus dem Arbeitsbereich eines Custom Vision Service-Projekts in Ihre eigene COCO-Datei in einem Speicherblob und steht für das Training mit der Anpassung des Bildanalysemodells bereit. Sie können den Code in diesem Abschnitt mithilfe eines benutzerdefinierten Python-Skripts ausführen, oder Sie können das Notebook herunterladen und auf einer kompatiblen Plattform ausführen.

Tipp

Inhalte von export_cvs_data_to_blob_storage.ipynb. In GitHub öffnen .

Python-Beispielpaket installieren

Führen Sie den folgenden Befehl aus, um das erforderliche Python-Beispielpaket zu installieren:

pip install cognitive-service-vision-model-customization-python-samples

Authentifizierung

Geben Sie als Nächstes die Anmeldeinformationen Ihres Custom Vision-Projekts und Ihres Blob Storage-Containers an.

Sie müssen die richtigen Parameterwerte eingeben. Sie benötigen die folgenden Informationen:

Der Name des Azure Storage-Kontos, das Sie mit Ihrem neuen benutzerdefinierten Modellprojekt verwenden möchten
Der Schlüssel für dieses Speicherkonto
Der Name des Containers, den Sie in diesem Speicherkonto verwenden möchten
Ihr Custom Vision-Trainingsschlüssel
Ihre Custom Vision-Endpunkt-URL
Die Projekt-ID Ihres Custom Vision-Projekts

Die Azure Storage-Anmeldeinformationen finden Sie auf der Seite dieser Ressource im Azure-Portal. Die Custom Vision-Anmeldeinformationen finden Sie auf der Seite Custom Vision-Projekteinstellungen im Custom Vision-Webportal.

azure_storage_account_name = ''
azure_storage_account_key = ''
azure_storage_container_name = ''

custom_vision_training_key = ''
custom_vision_endpoint = ''
custom_vision_project_id = ''

Ausführen der Migration

Wenn Sie den Migrationscode ausführen, werden die Custom Vision-Trainingsimages in dem Ordner „{project_name}_{project_id}/images“ in Ihrem angegebenen Azure Blob Storage-Container gespeichert, und die COCO-Datei wird unter „{project_name}_{project_id}/train.json“ demselben Container gespeichert. Sowohl markierte als auch nicht markierte Bilder werden exportiert, einschließlich aller negativ markierten Bilder.

Wichtig

Die Anpassung des Bildanalysemodells unterstützt derzeit kein Mehrzeichenklassifizierungstraining. Kaufen Sie können weiterhin Daten aus einem Custom Vision-Mehrzeichenklassifizierungsprojekt exportieren.

from cognitive_service_vision_model_customization_python_samples import export_data
import logging
logging.getLogger().setLevel(logging.INFO) 
logging.getLogger('azure.core.pipeline.policies.http_logging_policy').setLevel(logging.WARNING)

n_process = 8
export_data(azure_storage_account_name, azure_storage_account_key, azure_storage_container_name, custom_vision_endpoint, custom_vision_training_key, custom_vision_project_id, n_process)

Installieren von Bibliotheken

Dieses Skript erfordert bestimmte Python-Bibliotheken. Installieren Sie diese mit dem folgenden Befehl in Ihrem Projektverzeichnis.

pip install azure-storage-blob azure-cognitiveservices-vision-customvision cffi

Vorbereiten des Migrationsskripts

Erstellen einer neuen Python-Datei – beispielsweise export-cvs-data-to-coco.py. Öffnen Sie diese dann in einem Text-Editor, und fügen Sie den folgenden Inhalt ein.

from typing import List, Union
from azure.cognitiveservices.vision.customvision.training import CustomVisionTrainingClient
from azure.cognitiveservices.vision.customvision.training.models import Image, ImageTag, ImageRegion, Project
from msrest.authentication import ApiKeyCredentials
import argparse
import time
import json
import pathlib
import logging
from azure.storage.blob import ContainerClient, BlobClient
import multiprocessing


N_PROCESS = 8


def get_file_name(sub_folder, image_id):
    return f'{sub_folder}/images/{image_id}'


def blob_copy(params):
    container_client, sub_folder, image = params
    blob_client: BlobClient = container_client.get_blob_client(get_file_name(sub_folder, image.id))
    blob_client.start_copy_from_url(image.original_image_uri)
    return blob_client


def wait_for_completion(blobs, time_out=5):
    pendings = blobs
    time_break = 0.5
    while pendings and time_out > 0:
        pendings = [b for b in pendings if b.get_blob_properties().copy.status == 'pending']
        if pendings:
            logging.info(f'{len(pendings)} pending copies. wait for {time_break} seconds.')
            time.sleep(time_break)
            time_out -= time_break


def copy_images_with_retry(pool, container_client, sub_folder, images: List, batch_id, n_retries=5):
    retry_limit = n_retries
    urls = []
    while images and n_retries > 0:
        params = [(container_client, sub_folder, image) for image in images]
        img_and_blobs = zip(images, pool.map(blob_copy, params))
        logging.info(f'Batch {batch_id}: Copied {len(images)} images.')
        urls = urls or [b.url for _, b in img_and_blobs]

        wait_for_completion([b for _, b in img_and_blobs])
        images = [image for image, b in img_and_blobs if b.get_blob_properties().copy.status in ['failed', 'aborted']]
        n_retries -= 1
        if images:
            time.sleep(0.5 * (retry_limit - n_retries))

    if images:
        raise RuntimeError(f'Copy failed for some images in batch {batch_id}')

    return urls


class CocoOperator:
    def __init__(self):
        self._images = []
        self._annotations = []
        self._categories = []
        self._category_name_to_id = {}

    @property
    def num_imges(self):
        return len(self._images)

    @property
    def num_categories(self):
        return len(self._categories)

    @property
    def num_annotations(self):
        return len(self._annotations)

    def add_image(self, width, height, coco_url, file_name):
        self._images.append(
            {
                'id': len(self._images) + 1,
                'width': width,
                'height': height,
                'coco_url': coco_url,
                'file_name': file_name,
            })

    def add_annotation(self, image_id, category_id_or_name: Union[int, str], bbox: List[float] = None):
        self._annotations.append({
            'id': len(self._annotations) + 1,
            'image_id': image_id,
            'category_id': category_id_or_name if isinstance(category_id_or_name, int) else self._category_name_to_id[category_id_or_name]})

        if bbox:
            self._annotations[-1]['bbox'] = bbox

    def add_category(self, name):
        self._categories.append({
            'id': len(self._categories) + 1,
            'name': name
        })

        self._category_name_to_id[name] = len(self._categories)

    def to_json(self) -> str:
        coco_dict = {
            'images': self._images,
            'categories': self._categories,
            'annotations': self._annotations,
        }

        return json.dumps(coco_dict, ensure_ascii=False, indent=2)


def log_project_info(training_client: CustomVisionTrainingClient, project_id):
    project: Project = training_client.get_project(project_id)
    proj_settings = project.settings
    project.settings = None
    logging.info(f'Project info dict: {project.__dict__}')
    logging.info(f'Project setting dict: {proj_settings.__dict__}')
    logging.info(f'Project info: n tags: {len(training_client.get_tags(project_id))},'
                 f' n images: {training_client.get_image_count(project_id)} (tagged: {training_client.get_tagged_image_count(project_id)},'
                 f' untagged: {training_client.get_untagged_image_count(project_id)})')


def export_data(azure_storage_account_name, azure_storage_key, azure_storage_container_name, custom_vision_endpoint, custom_vision_training_key, custom_vision_project_id, n_process):
    azure_storage_account_url = f"https://{azure_storage_account_name}.blob.core.windows.net"
    container_client = ContainerClient(azure_storage_account_url, azure_storage_container_name, credential=azure_storage_key)
    credentials = ApiKeyCredentials(in_headers={"Training-key": custom_vision_training_key})
    trainer = CustomVisionTrainingClient(custom_vision_endpoint, credentials)

    coco_operator = CocoOperator()
    for tag in trainer.get_tags(custom_vision_project_id):
        coco_operator.add_category(tag.name)

    skip = 0
    batch_id = 0
    project_name = trainer.get_project(custom_vision_project_id).name
    log_project_info(trainer, custom_vision_project_id)
    sub_folder = f'{project_name}_{custom_vision_project_id}'
    with multiprocessing.Pool(n_process) as pool:
        while True:
            images: List[Image] = trainer.get_images(project_id=custom_vision_project_id, skip=skip)
            if not images:
                break
            urls = copy_images_with_retry(pool, container_client, sub_folder, images, batch_id)
            for i, image in enumerate(images):
                coco_operator.add_image(image.width, image.height, urls[i], get_file_name(sub_folder, image.id))
                image_tags: List[ImageTag] = image.tags
                image_regions: List[ImageRegion] = image.regions
                if image_regions:
                    for img_region in image_regions:
                        coco_operator.add_annotation(coco_operator.num_imges, img_region.tag_name, [img_region.left, img_region.top, img_region.width, img_region.height])
                elif image_tags:
                    for img_tag in image_tags:
                        coco_operator.add_annotation(coco_operator.num_imges, img_tag.tag_name)

            skip += len(images)
            batch_id += 1

    coco_json_file_name = 'train.json'
    local_json = pathlib.Path(coco_json_file_name)
    local_json.write_text(coco_operator.to_json(), encoding='utf-8')
    coco_json_blob_client: BlobClient = container_client.get_blob_client(f'{sub_folder}/{coco_json_file_name}')
    if coco_json_blob_client.exists():
        logging.warning(f'coco json file exists in blob. Skipped uploading. If existing one is outdated, please manually upload your new coco json from ./train.json to {coco_json_blob_client.url}')
    else:
        coco_json_blob_client.upload_blob(local_json.read_bytes())
        logging.info(f'coco file train.json uploaded to {coco_json_blob_client.url}.')


def parse_args():
    parser = argparse.ArgumentParser('Export Custom Vision workspace data to blob storage.')

    parser.add_argument('--custom_vision_project_id', '-p', type=str, required=True, help='Custom Vision Project Id.')
    parser.add_argument('--custom_vision_training_key', '-k', type=str, required=True, help='Custom Vision training key.')
    parser.add_argument('--custom_vision_endpoint', '-e', type=str, required=True, help='Custom Vision endpoint.')

    parser.add_argument('--azure_storage_account_name', '-a', type=str, required=True, help='Azure storage account name.')
    parser.add_argument('--azure_storage_account_key', '-t', type=str, required=True, help='Azure storage account key.')
    parser.add_argument('--azure_storage_container_name', '-c', type=str, required=True, help='Azure storage container name.')

    parser.add_argument('--n_process', '-n', type=int, required=False, default=8, help='Number of processes used in exporting data.')

    return parser.parse_args()


def main():
    args = parse_args()

    export_data(args.azure_storage_account_name, args.azure_storage_account_key, args.azure_storage_container_name,
                args.custom_vision_endpoint, args.custom_vision_training_key, args.custom_vision_project_id, args.n_process)


if __name__ == '__main__':
    main()

Ausführen des Skripts

Führen Sie das Skript mithilfe des Befehls python aus.

python export-cvs-data-to-coco.py -p <project ID> -k <training key> -e <endpoint url> -a <storage account> -t <storage key> -c <container name>

Sie müssen die richtigen Parameterwerte eingeben. Sie benötigen die folgenden Informationen:

Die Projekt-ID Ihres Custom Vision-Projekts
Ihr Custom Vision-Trainingsschlüssel
Ihre Custom Vision-Endpunkt-URL
Der Name des Azure Storage-Kontos, das Sie mit Ihrem neuen benutzerdefinierten Modellprojekt verwenden möchten
Der Schlüssel für dieses Speicherkonto
Der Name des Containers, den Sie in diesem Speicherkonto verwenden möchten

Verwenden der COCO-Datei in einem neuen Projekt

Das Skript generiert eine COCO-Datei und lädt sie in den von Ihnen angegebenen Blobspeicherort hoch. Sie können sie jetzt in Ihr Modellanpassungsprojekt importieren. Lesen Sie Erstellen und Trainieren eines benutzerdefinierten Modells, und wechseln Sie zum Abschnitt über das Auswählen/Importieren einer COCO-Datei. Sie können der Anleitung von dort bis zum Ende folgen.

Nächste Schritte

Erstellen und Trainieren eines benutzerdefiniertes Modells

Teilen über