Esplorare l'architettura della soluzione

Completato

È importante comprendere il quadro generale prima di procedere con l'implementazione per garantire che tutti i requisiti siano soddisfatti. Vogliamo anche garantire che l'approccio sia facilmente adattabile in futuro. L'obiettivo di questo esercizio consiste nell'iniziare a usare GitHub Actions come strumento di orchestrazione e automazione per la strategia di machine learning operations (MLOps) definita nell'architettura della soluzione.

Diagramma dell'architettura delle operazioni di Machine Learning.

Nota

Il diagramma è una rappresentazione semplificata di un'architettura MLOps. Per visualizzare un'architettura più dettagliata, esaminare i vari casi d'uso nell'acceleratore di soluzioni MLOps (v2).

L'architettura include:

  1. Installazione: creare tutte le risorse di Azure necessarie per la soluzione.
  2. Sviluppo di modelli (ciclo interno): esplorare ed elaborare i dati per eseguire il training e valutare il modello.
  3. Integrazione continua: creare un pacchetto e registrare il modello.
  4. Distribuzione del modello (ciclo esterno): distribuire il modello.
  5. Distribuzione continua: testare il modello e promuovere l'ambiente di produzione.
  6. Monitoraggio: monitorare le prestazioni del modello e dell'endpoint.

In particolare, verrà automatizzata la parte di training dello sviluppo del modello o del ciclo interno, che in ultima analisi consente di eseguire rapidamente il training e la registrazione di più modelli per la distribuzione in ambienti di staging e produzione.

L'area di lavoro di Azure Machine Learning, il calcolo di Azure Machine Learning e il repository GitHub sono stati creati automaticamente dal team dell'infrastruttura.

Inoltre, il codice per eseguire il training del modello di classificazione è pronto per la produzione e i dati necessari per eseguire il training del modello sono disponibili in un archivio BLOB di Azure connesso all'area di lavoro di Azure Machine Learning.

L'implementazione consentirà di passare dal ciclo interno a quello esterno in modo che sia un processo automatizzato che si verifica ogni volta che un data scientist esegue il push del nuovo codice del modello nel repository GitHub, consentendo il recapito continuo dei modelli di Machine Learning ai consumer downstream del modello, ad esempio l'applicazione Web che userà il modello di classificazione diabetes.