Concetti di ottimizzazione dei modelli

La messa a punto consente di adattare i modelli di intelligenza artificiale pre-addestrati per lavorare meglio con i tuoi dati specifici e casi d'uso. Questa tecnica può migliorare le prestazioni del modello, richiedendo meno dati di training rispetto alla creazione di un modello da zero.

Questo articolo tratta:

Che cos'è l'ottimizzazione e come funziona
Quando usare l'ottimizzazione e altri approcci
Come selezionare e preparare i modelli per l'ottimizzazione
Procedure consigliate per l'iterazione e il miglioramento dei risultati

Prerequisiti

Prima di iniziare, è necessario disporre di:

Conoscenza di base dei concetti di Machine Learning
Familiarità con i casi d'uso e i requisiti dei dati specifici
Accesso ai dati di esempio per il training e la convalida

Che cos'è l'ottimizzazione?

Il fine-tuning è una tecnica di machine learning che adatta un modello pre-addestrato per migliorare le prestazioni su un compito specifico. Anziché eseguire il training di un modello da zero, iniziare con un modello che comprende già i modelli generali e modificarlo per lavorare con i dati.

Questo approccio sfrutta l'apprendimento di trasferimento, usando le conoscenze acquisite da un'attività per migliorare le prestazioni in un'attività correlata. Il fine-tuning è particolarmente efficace quando si hanno dati di training limitati o si vuole costruire su funzionalità del modello esistenti.

Quando ottimizzare

L'ottimizzazione è ottimale quando si dispone di una piccola quantità di dati e si vuole migliorare le prestazioni del modello. A partire da un modello pre-addestrato, è possibile applicare la conoscenza già acquisita e modificarla per adattarlo meglio ai tuoi dati. Questo approccio consente di migliorare le prestazioni del modello e di ridurre la quantità di dati necessari per il training.

Quando si dispone di una grande quantità di dati, in genere non è necessario ottimizzare il modello. È possibile eseguire il training del modello da zero e ottenere buoni risultati senza ottimizzare. Tuttavia, l'ottimizzazione può comunque essere utile se si desidera migliorare le prestazioni del modello. È anche possibile ottimizzare il modello se si dispone di un'attività specifica diversa dall'attività su cui il modello è stato originariamente addestrato.

È possibile evitare costose ottimizzazioni usando l'ingegneria dei prompt o il collegamento dei prompt. Queste tecniche consentono di generare testo di alta qualità senza ottimizzazione.

Selezionare un modello pre-addestrato

Scegli un modello preaddestrato che soddisfi i requisiti dell'attività. Sono disponibili molti modelli pre-addestrati, ognuno addestrato su compiti diversi. Selezionare un modello sottoposto a training su un'attività simile alla propria. Questa scelta consente di usare le conoscenze già apprese dal modello e modificarle in base ai dati.

Hugging Face modelli sono un buon punto di partenza quando si cercano modelli pre-addestrati. I Hugging Face modelli sono raggruppati in categorie in base all'attività su cui è stato eseguito il training, semplificando la ricerca di un modello adatto all'attività.

Queste categorie includono:

Multimodale
Visione artificiale
Elaborazione del linguaggio naturale
Suono
Tabellare
Apprendimento per rinforzo

Controllare se il modello funziona con l'ambiente e gli strumenti. Ad esempio, se si usa Visual Studio Code (VS Code), è possibile usare l'estensione Azure Machine Learning per VS Code per ottimizzare il modello.

Controllare lo stato e la licenza del modello. Alcuni modelli con training preliminare sono disponibili con una licenza open source, mentre altri richiedono una licenza commerciale o personale. Tutti i modelli in Hugging Face includono informazioni sulla licenza. Assicurarsi di disporre delle autorizzazioni necessarie per usare il modello prima di ottimizzarlo.

Preparare i dati di esempio

La preparazione dei dati di esempio comporta la pulizia e la pre-elaborazione dei dati per renderli utilizzabili nell'addestramento. È anche necessario suddividere i dati in set di training e convalida per valutare le prestazioni del modello. Il formato dei dati deve corrispondere al formato previsto dal modello pre-addestrato usato. È possibile trovare queste informazioni con i modelli Hugging Face nella sezione Formato istruzioni della scheda modello. La maggior parte delle schede di modello include un modello per la creazione di un prompt per il modello e del pseudocodice per aiutarti a iniziare.

Iterare sul tuo modello

Dopo aver ottimizzato il modello, valutarne le prestazioni nel set di convalida. Usare metriche come accuratezza, precisione, richiamo e punteggio F1 per valutare le prestazioni del modello. Se le prestazioni del modello non sono soddisfacenti, modificare gli iperparametri, modificare l'architettura o ottimizzare il modello su più dati. È anche possibile esaminare la qualità e la diversità dei dati per verificare se sono presenti problemi da risolvere. Come regola generale, un set più piccolo di dati di alta qualità è più prezioso di un set più ampio di dati di bassa qualità.

Vedere anche

Per altre informazioni sull'ottimizzazione dei modelli di intelligenza artificiale, vedere le risorse seguenti:

Quando si utilizzano le funzionalità di intelligenza artificiale, consultare: Developing Responsible Generative AI Applications and Features on Windows.

Commenti e suggerimenti

Questa pagina è stata utile?

Last updated on 2025-11-17