Eventi
Creare app e agenti di intelligenza artificiale
17 mar, 21 - 21 mar, 10
Partecipa alla serie meetup per creare soluzioni di intelligenza artificiale scalabili basate su casi d'uso reali con altri sviluppatori ed esperti.
Iscriviti subitoQuesto browser non è più supportato.
Esegui l'aggiornamento a Microsoft Edge per sfruttare i vantaggi di funzionalità più recenti, aggiornamenti della sicurezza e supporto tecnico.
Questa guida introduttiva illustra come usare il sito Web di Visione personalizzata per creare un modello di rilevamento oggetti. Dopo aver compilato un modello, è possibile testarlo con nuove immagini e integrarlo nell'app di riconoscimento delle immagini.
Per usare il servizio Visione personalizzata, è necessario creare Visione personalizzata risorse di training e previsione in Azure. Nella portale di Azure usare la pagina Crea Visione personalizzata per creare sia una risorsa di training che una risorsa di stima.
Nel Web browser passare al sito Web Visione personalizzata. Accedere con lo stesso account usato per il portale di Azure.
Per creare il primo progetto, selezionare New Project (Nuovo progetto). Viene visualizzata la finestra di dialogo Crea nuovo progetto.
Immettere un nome e una descrizione per il progetto. Selezionare quindi la risorsa di training Visione personalizzata. Se l'account connesso è associato a un account Azure, nell'elenco a discesa Risorsa vengono visualizzate tutte le risorse di Azure compatibili.
Nota
Se non è disponibile alcuna risorsa, verificare di aver eseguito l'accesso a customvision.ai con lo stesso account usato per accedere al portale di Azure. Verificare inoltre di aver selezionato la stessa directory nel sito Web Visione personalizzata della directory nella portale di Azure in cui si trovano le risorse Visione personalizzata. In entrambi i siti è possibile selezionare la directory dal menu a discesa dell'account nell'angolo in alto a destra della schermata.
In Tipi di progetto selezionare Rilevamento oggetti.
Selezionare uno dei domini disponibili. Ogni dominio ottimizza il rilevatore per tipi specifici di immagini, come descritto nella tabella seguente. È possibile modificare il dominio in un secondo momento, se necessario.
Domain | Scopo |
---|---|
Generali | Ottimizzato per un'ampia gamma di attività di rilevamento oggetti. Se nessuno degli altri domini risulta appropriato o si è in dubbio sul dominio da scegliere, selezionare il dominio Generale. |
Logo | Ottimizzato per il rilevamento di logo dei marchi nelle immagini. |
Prodotti sugli scaffali | Ottimizzato per il rilevamento e la classificazione dei prodotti sugli scaffali. |
Domini compatti | Ottimizzati per i vincoli di rilevamento in tempo reale su dispositivi mobili. I modelli generati da domini compatti possono essere esportati per l'esecuzione in locale. |
Selezionare infine Crea progetto.
Come minimo, è consigliabile usare almeno 30 immagini per tag nel set di training iniziale. È anche necessario raccogliere alcune immagini aggiuntive per testare il modello dopo il training.
Per eseguire il training del modello in modo efficace, usare le immagini con diversi oggetti visivi. Selezionare immagini diverse per:
Assicurarsi anche che tutte le immagini di training soddisfino i criteri seguenti:
In questa sezione si caricano e si aggiungono manualmente i tag alle immagini per eseguire il training del rilevatore.
Per aggiungere immagini, selezionare Aggiungi immagini seguito da Esplora file locali. Selezionare Apri per caricare le immagini.
Le immagini caricate verranno visualizzate nella sezione Senza tag dell'interfaccia utente. Il passaggio successivo prevede l'aggiunta manuale dei tag agli oggetti che il rilevatore dovrà riconoscere. Selezionare la prima immagine per aprire la finestra di dialogo per l'aggiunta dei tag.
Selezionare e trascinare un rettangolo intorno all'oggetto nell'immagine. Immettere quindi un nuovo nome di tag con il pulsante + oppure selezionare un tag esistente dall'elenco a discesa. È importante contrassegnare ogni istanza degli oggetti che si desidera rilevare, perché il rilevatore usa l'area di sfondo senza tag come esempio negativo nel training. Dopo aver aggiunto i tag, selezionare la freccia a destra per salvarli e per passare all'immagine successiva.
Per caricare un altro set di immagini, tornare all'inizio di questa sezione e ripetere i passaggi.
Per eseguire il training del modello di rilevatore, selezionare il pulsante Esegui il training. Il rilevatore usa tutte le immagini correnti e i relativi tag per creare un modello in grado di identificare ogni oggetto con tag. Questo processo può richiedere alcuni minuti.
Il processo di training dovrebbe richiedere solo alcuni minuti. Durante questo periodo, vengono visualizzate informazioni sul processo di training nella scheda Prestazioni.
Al termine del training, le prestazioni del modello vengono calcolate e visualizzate. Il servizio Visione personalizzata usa le immagini inviate per il training per calcolare precisione e recupero e precisione media. Precisione e recupero sono due misure diverse dell'efficacia di un rilevatore:
Si noti il dispositivo di scorrimento Probability Threshold (Soglia probabilità) nel riquadro sinistro della scheda Prestazioni. Questo è il livello di confidenza che una stima deve avere per essere considerata corretta (ai fini del calcolo della precisione e del richiamo).
Quando si interpretano le chiamate di stima con una soglia di probabilità alta, i risultati restituiti tendono ad avere una precisione elevata a scapito del richiamo, ossia le classificazioni rilevate sono corrette, ma molte rimangono non rilevate. Con una soglia di probabilità bassa avviene l'opposto, ossia viene rilevata la maggior parte delle classificazioni, ma all'interno del set sono presenti più falsi positivi. Tenendo presente questo aspetto, è consigliabile impostare la soglia di probabilità in base alle esigenze specifiche del progetto. In seguito, quando si ricevono i risultati della stima sul lato client, è consigliabile usare lo stesso valore di soglia di probabilità usato qui.
Il dispositivo di scorrimento Sovrapposizione soglia gestisce il modo in cui una stima dell'oggetto deve essere considerata corretta nel training. Imposta la sovrapposizione minima consentita tra il rettangolo delimitatore dell'oggetto previsto e il rettangolo delimitatore effettivo immesso dall'utente. Se i rettangoli di selezione non si sovrappongono a questo livello, la stima non viene considerata corretta.
Ogni volta che si esegue il training del rilevatore, si crea una nuova iterazione con le relative metriche delle prestazioni aggiornate. È possibile visualizzare tutte le iterazioni nel riquadro sinistro della scheda Prestazioni . Nel riquadro sinistro si trova anche il pulsante Elimina , che è possibile usare per eliminare un'iterazione se obsoleta. Quando si elimina un'iterazione, vengono eliminate anche tutte le immagini associate in modo univoco a tale iterazione.
Per informazioni su come accedere ai modelli sottoposti a training a livello di codice, vedere Usare il modello con l'API di stima.
In questa esercitazione dell'avvio rapido si è appreso a creare ed eseguire il training di un modello di rilevamento oggetti tramite il sito Web di Visione personalizzata. È ora possibile ottenere altre informazioni sul processo iterativo per migliorare il modello.
Per una panoramica, vedere Che cos'è Visione personalizzata?
Eventi
Creare app e agenti di intelligenza artificiale
17 mar, 21 - 21 mar, 10
Partecipa alla serie meetup per creare soluzioni di intelligenza artificiale scalabili basate su casi d'uso reali con altri sviluppatori ed esperti.
Iscriviti subitoFormazione
Percorso di apprendimento
Creare modelli di visione con Visione personalizzata di Azure AI - Training
Come creare soluzioni di visione artificiale personalizzate con Visione personalizzata di Azure AI
Certificazione
Microsoft Certified: Azure Data Scientist Associate - Certifications
Gestire l'inserimento e la preparazione dei dati, il training e la distribuzione di modelli e il monitoraggio delle soluzioni di apprendimento automatico con Python, Azure Machine Learning e MLflow.