Nozioni di base di data science per il Machine Learning

Principiante
Intermedio
AI engineer
Data scientist
Sviluppatore
Studente
Azure

Microsoft Learn offre varie modalità interattive per conseguire un'introduzione al Machine Learning classico. Questi percorsi di apprendimento consentono di raggiungere l'autonoma produttiva e costituiscono un ottimo punto di partenza per affrontare argomenti di Deep Learning.

Dai classici modelli di Machine Learning di base all'analisi esplorativa dei dati fino alle architetture di personalizzazione, semplici contenuti concettuali e interattivi notebook di Jupyter permetteranno di acquisire tutte le informazioni necessarie senza mai uscire dal browser.

Scegliere il percorso più appropriato in base al background didattico personale e ai propri interessi.

✔ Opzione 1: Corso completo: Nozioni di base di data science per il Machine Learning

Questo percorso è consigliato per la maggior parte delle persone. Presenta gli stessi moduli degli altri due percorsi di apprendimento, ma con un flusso personalizzato che favorisce il potenziamento dei concetti. Questo percorso è adatto per coloro che vogliono acquisire informazioni sui concetti sottostanti e imparare a creare nuovi modelli con gli strumenti di Machine Learning più comuni. È il percorso migliore anche per tutti colori che non vogliono fermarsi al Machine Learning di base ma intendono conseguire una formazione completa nel Deep Learning e nelle reti neurali, che verranno solo accennate in questa sede.

✔ Questo è il percorso in cui ci si trova attualmente; scorrere verso il basso per iniziare.

Opzione 2: Percorso di aggiornamento Informazioni sul data science per Machine Learning

Questo percorso è adatto per coloro che vogliono capire meglio il funzionamento del Machine Learning ma non hanno particolari conoscenze matematiche. Non presuppone alcuna formazione preliminare (se non una leggera familiarità con i concetti di scrittura del codice) e si avvale di frammenti di codice, metafore e oggetti visivi per trasmettere le informazioni. Anche se si tratta di un percorso pratico, è maggiormente incentrato sul delineamento dei concetti fondamentali a discapito degli strumenti e delle librerie disponibili.

Opzione 3: Percorso di apprendimento Creare modelli di Machine Learning

Se si conoscono già i concetti di base del Machine Learning oppure si ha una solida conoscenza matematica, è possibile passare direttamente al percorso di apprendimento Creare modelli di Machine Learning. Questi moduli affrontano alcuni concetti del Machine Learning, ma procedono rapidamente per passare a illustrare l'utilizzo di strumenti come scikit-learn, TensorFlow e PyTorch. Questo percorso di apprendimento è indicato anche per coloro che vogliono soltanto acquisire la familiarità necessaria per capire gli esempi di Machine Learning relativi a prodotti come Azure ML o Azure Databricks.

Prerequisiti

None

Moduli in questo percorso di apprendimento

Panoramica generale sul Machine Learning per persone con poca o nessuna conoscenza di informatica e statistica. Verranno illustrati alcuni concetti essenziali, verranno esplorati i dati e verrà illustrato in modo interattivo il ciclo di vita del Machine Learning, usando Python per il training, il salvataggio e l'uso di un modello di Machine Learning come si farebbe nel mondo reale.

L'apprendimento supervisionato è una forma di apprendimento automatico in cui un algoritmo apprende da esempi di dati. Andando avanti verrà spiegato come usare l'apprendimento supervisionato per generare automaticamente un modello in grado di eseguire stime sul mondo reale. Verranno illustrate anche le modalità di test di questi modelli e le difficoltà che possono verificarsi durante il training.

La potenza dei modelli di Machine Learning deriva dai dati usati per il training. Attraverso documentazione ed esercizi, viene illustrato come comprendere i dati, come codificarli in modo che il computer possa interpretarli correttamente, come pulirli dagli errori e vengono forniti suggerimenti che consentono di creare modelli con prestazioni elevate.

L'esplorazione e l'analisi dei dati sono alla base della data science. Gli scienziati dei dati richiedono competenze in linguaggi di programmazione come Python per esplorare, visualizzare e modificare i dati.

La regressione è probabilmente la tecnica di Machine Learning più usata, comunemente alla base di scoperte scientifiche, pianificazione aziendale e analisi del mercato azionario. Questo materiale didattico illustra alcune analisi di regressione comuni, sia semplici che più complesse, e fornisce informazioni dettagliate su come valutare le prestazioni del modello.

Quando si pensa all'apprendimento automatico, spesso ci si concentra sul processo di training. Una certa preparazione prima di questo processo può non solo velocizzare e migliorare l'apprendimento, ma anche offrire una certa sicurezza sul buon funzionamento dei modelli in presenza di dati mai visti prima.

La regressione è un tipo di Machine Learning comunemente usato per predire valori numerici.

Con il termine classificazione si intende l'assegnazione di elementi a categorie diverse, ma tale termine può essere applicato anche a un processo decisionale automatizzato. In questo articolo vengono presentati i modelli di classificazione tramite la regressione logistica, che rappresentano solo un primo passo verso metodi di classificazione più complessi ed interessanti.

I modelli più complessi spesso possono essere personalizzati manualmente per migliorarne l'efficacia. Tramite esercizi e contenuti esplicativi, viene illustrato in che modo la modifica dell'architettura di modelli più complessi può portare a risultati più efficaci.

Come è possibile sapere se un modello è valido o meno per la classificazione dei dati? Il modo in cui i computer valutano le prestazioni del modello può talvolta essere difficilmente comprensibile oppure può comportare una eccessiva semplificazione del comportamento del modello nel mondo reale. Per creare modelli che funzionino in modo soddisfacente, è necessario individuare metodi intuitivi per valutarli e comprendere in che modo queste metriche possono condizionare la percezione.

Le curve delle caratteristiche operative del ricevitore (ROC, Receiver Operator Characteristic) sono un modo efficace per valutare e ottimizzare i modelli di classificazione con training. In questo modulo verrà illustrata l'utilità di queste curve tramite contenuto di apprendimento ed esercizi pratici.

La classificazione è un tipo di Machine Learning usato per classificare gli elementi in classi.

Il clustering è un tipo di Machine Learning usato per raggruppare elementi simili in cluster.

Il Deep Learning è una forma avanzata di Machine Learning che emula il modo in cui il cervello umano apprende attraverso reti di neuroni connessi.