Azure AI Studio: Come posso addestrare efficacemente un modello?

Alfonso Faiella 0 Punti di reputazione
2024-03-27T09:11:38.4066667+00:00

Abbiamo una serie di documenti contenenti materiale e documentazione di un software e vogliamo utilizzare "Azure AI on your data" per creare un assistente in grado di aiutarci nel supporto ai tecnici interni e al servizio di assistenza. L'approccio che stiamo utilizzando è quello di eseguire il "data ingest", caricando i dati da un container blob in Azure e utilizzando un indice che sfrutta la ricerca vettoriale. Ad oggi, i risultati non sono soddisfacenti e pertanto è necessario capire quale sia il motivo.

Potrebbe essere la quantità eccessiva di dati o la struttura stessa dei dati (che richiedono un'elaborazione specifica)?

Ci sono alcuni dubbi che sono sorti:

  1. Per ottenere risultati soddisfacenti, come dovrebbero essere strutturati i dati in modo da sfruttare appieno l'indice creato? Come dovrebbero essere utilizzati i campi con le opzioni "ricercabile/filtrabile/etc."?
  2. Come si configura correttamente la ricerca vettoriale dell'indice utilizzando i profili vettoriali?
  3. Come si conferisce una validità temporale ai dati, in modo che l'AI risponda in base al periodo di riferimento? Ad esempio, se ho due norme e una è stata abrogata, come faccio a farlo capire all'AI?
  4. Come si aggiorna l'indice in tempo reale in caso di cambiamento dei dati (eliminazione/inserimento)? Non sempre, al momento dell'aggiornamento dell'indice, i dati vengono correttamente aggiornati, nonostante l'origine dati associata all'indice abbia la funzione di rilevare le cancellazioni (questo avviene soprattutto con la ricerca di tipo vettoriale).
  5. C'è un limite dei documenti dopo il quale l'indice si "riempie" e non indicizza più i dati, facendo sì che non ci accorgiamo più di "perderli"?
  6. Abbiamo provato anche a eseguire il fine-tuning, ma il materiale formattabile nel formato JSONL (prompt, completion) era molto sporco e non copriva tutto il dominio applicativo, pertanto i risultati sono stati pessimi. Ci potete dare suggerimenti su come aggirare questi problemi?

Ogni aiuto o un suggerimento su qualcuno di questi problemi / dubbi sarà gradito.

Azure
Azure
Una piattaforma e un'infrastruttura di cloud computing per la creazione, la distribuzione e la gestione di applicazioni e servizi tramite una rete mondiale di data center gestiti da Microsoft.
100 domande
0 commenti Nessun commento
{count} voti

1 risposta

Ordina per: Più utili
  1. Yordan Ivanov 535 Punti di reputazione
    2024-03-27T14:35:34.9533333+00:00

    Buongiorno, Alfonso,

    Grazie per il suo post e tutte queste domande.

    Proverò a darti risposte su tutto, iniziando con articoli che spiegano come fare il necessario da te:

    1. Struttura dei dati: https://learn.microsoft.com/it-it/azure/search/vector-search-overview
    2. Configurazione delle ricerche vettoriali: https://learn.microsoft.com/it-it/azure/search/vector-search-how-to-configure-vectorizer
    3. Come si conferisce una validità temporale ai dati: https://learn.microsoft.com/it-it/azure/azure-sql/temporal-tables?view=azuresql
    4. Come si aggiorna l'indice in tempo reale in caso di cambiamento dei dati: https://learn.microsoft.com/it-it/azure/ai-services/openai/concepts/use-your-data?tabs=ai-search
    5. C'è un limite dei documenti: Se le tue considerazioni sono incentrate sulla "connessione ai miei dati" e sulla "quantità di dati", la funzione Sui tuoi dati potrebbe essere un'opzione più adatta a te. I dati per questa funzionalità vengono archiviati nel BLOB di Azure e nella ricerca AI di Azure, il che consente essenzialmente di considerarli come in grado di supportare una quantità illimitata di dati.
    6. fine-tuning: https://learn.microsoft.com/it-it/azure/ai-services/openai/how-to/fine-tuning?tabs=turbo%2Cpython-new&pivots=programming-language-studio

    Sotto, alcuni articoli che darebbero ulteriori informazioni di base:

    Che cos'è Azure AI Studio?
    https://learn.microsoft.com/it-it/azure/ai-studio/what-is-ai-studio?tabs=home

    Che cosa sono i servizi di intelligenza artificiale di Azure?

    https://learn.microsoft.com/it-it/azure/ai-services/what-are-ai-services?context=%2Fazure%2Fai-studio%2Fcontext%2Fcontext

    0 commenti Nessun commento

Risposta

Le risposte possono essere contrassegnate come risposte accettate dall'autore della domanda. Ciò consente agli utenti di sapere che la risposta ha risolto il problema dell'autore.