Condividi tramite


Concetti di ottimizzazione dei modelli

L'ottimizzazione è un processo di pre-training di un modello con training preliminare e di modificarlo in modo da adattarli meglio ai dati. Questo processo consente di sfruttare al meglio i dati e migliorare le prestazioni del modello. In questo articolo verranno illustrati i concetti di base dell'ottimizzazione e l'ottimizzazione di un modello di intelligenza artificiale appropriato.

Introduzione

L'ottimizzazione è una tecnica potente che consente di ottenere più dati. Per comprendere l'ottimizzazione, è importante comprendere il concetto di apprendimento per il trasferimento. Il trasferimento dell'apprendimento è una tecnica di Machine Learning in cui un modello sottoposto a training su un'attività viene rivalutato in una seconda attività correlata. Questa operazione viene eseguita prendendo un modello con training preliminare e modificandolo in modo da adattarli meglio ai nuovi dati. L'ottimizzazione è una forma di apprendimento sul trasferimento in cui il modello con training preliminare viene regolato in modo da adattarli meglio ai nuovi dati.

L'ottimizzazione di un modello comporta diversi passaggi. Prima di tutto, è necessario selezionare un modello con training preliminare adatto per l'attività. Successivamente, è necessario preparare i dati di esempio e ottimizzare il modello su questi dati. Infine, è necessario scorrere il modello per migliorarne le prestazioni.

Quando ottimizzare

L'ottimizzazione è adatta per i tempi in cui si dispone di una piccola quantità di dati e si vuole migliorare le prestazioni del modello. A partire da un modello con training preliminare, è possibile sfruttare le conoscenze già apprese dal modello e modificarle per adattarli meglio ai dati. Ciò consente di migliorare le prestazioni del modello e ridurre la quantità di dati necessari per eseguirne il training.

In genere non è necessario ottimizzare il modello quando si dispone di una grande quantità di dati. In questo caso, è possibile eseguire il training del modello da zero e ottenere prestazioni ottimali senza ottimizzare. Tuttavia, l'ottimizzazione può comunque essere utile in questo caso se si desidera migliorare ulteriormente le prestazioni del modello. È anche possibile ottimizzare il modello se si dispone di un'attività specifica diversa dall'attività su cui è stato eseguito il training del modello con training preliminare.

È possibile evitare l'ottimizzazione costosa di un modello usando la progettazione dei prompt o il concatenamento delle richieste. Queste tecniche consentono di generare testo di alta qualità senza la necessità di ottimizzare.

Selezionare un modello con training preliminare

È consigliabile selezionare un modello con training preliminare adatto ai requisiti dell'attività. Sono disponibili molti modelli con training preliminare sottoposti a training su un'ampia gamma di attività. È consigliabile scegliere un modello sottoposto a training su un'attività simile a quella su cui si sta lavorando. In questo modo sarà possibile sfruttare le conoscenze già apprese dal modello e modificarle per adattarli meglio ai dati.

HuggingFace I modelli sono un buon punto di partenza quando si cercano modelli con training preliminare. I HuggingFace modelli sono raggruppati in categorie in base all'attività su cui è stato eseguito il training, semplificando la ricerca di un modello adatto per l'attività.

Queste categorie includono:

  • Multimodale
  • Visione artificiale
  • Elaborazione del linguaggio naturale
  • Audio
  • tabulare
  • Apprendimento per rinforzo

Controllare la compatibilità del modello con l'ambiente e gli strumenti in uso. Ad esempio, se si usa Visual Studio Code, è possibile usare l'estensione Azure Machine Learning per Visual Studio Code per ottimizzare il modello.

Controllare lo stato e la licenza del modello. Alcuni modelli con training preliminare possono essere disponibili con una licenza open source, mentre altri potrebbero richiedere una licenza commerciale o personale da usare. Tutti i modelli includono informazioni sulla HuggingFace licenza. Assicurarsi di disporre delle autorizzazioni necessarie per usare il modello prima di ottimizzarlo.

Preparare i dati di esempio

La preparazione dei dati di esempio comporta la pulizia e la pre-elaborazione dei dati per renderli adatti al training. È anche necessario suddividere i dati in set di training e convalida per valutare le prestazioni del modello. Il formato dei dati deve corrispondere al formato previsto dal modello con training preliminare in uso. Queste informazioni sono disponibili con i modelli HuggingFace nella sezione Formato istruzione della scheda modello. La maggior parte delle schede modello includerà un modello per la compilazione di una richiesta per il modello e alcuni pseudo-codice per iniziare.

Eseguire l'iterazione sul modello

Dopo aver ottimizzato il modello, è necessario valutarne le prestazioni nel set di convalida. È possibile usare metriche come accuratezza, precisione, richiamo e punteggio F1 per valutare le prestazioni del modello. Se le prestazioni del modello non sono soddisfacenti, è possibile scorrere il modello modificando gli iperparametri, modificando l'architettura o ottimizzando il modello su più dati. È anche possibile esaminare la qualità e la diversità dei dati per verificare se sono presenti problemi da risolvere. Come regola generale, un set più piccolo di dati di alta qualità è più prezioso di un set più ampio di dati di bassa qualità.

Vedi anche

Per altre informazioni sull'ottimizzazione dei modelli di intelligenza artificiale, vedere le risorse seguenti: