Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Importante
Questa funzionalità è in versione beta.
Questa pagina fornisce esempi di notebook per la creazione di sistemi di raccomandazione con calcolo GPU serverless. Questi esempi illustrano come creare modelli di raccomandazione efficienti usando approcci moderni di Deep Learning.
Modello di raccomandazione a due torre
Questi notebook illustrano come convertire i dati di raccomandazione in formato MDS (Mosaic Data Shard) e quindi usare tali dati per creare un modello di raccomandazione a due torre. Questo approccio è particolarmente efficace per i sistemi di raccomandazione su larga scala.
Preparazione dei dati: convertire il set di dati del modello di raccomandazione in formato MDS
Prima di tutto, convertire il set di dati delle raccomandazioni nel formato MDS per un caricamento efficiente dei dati:
Convertire i dati
Addestramento del modello: Modello di raccomandazione a due torri con PyTorch Lightning
Eseguire il training del modello di raccomandazione a due torre usando il set di dati preparato e l'API PyTorch Lightning Trainer su più nodi GPU (GPU A10 o H100).
Sistema di raccomandazione con PyTorch
Esempio: Ottimizzare i modelli di incorporamento con llm-foundry nel calcolo GPU serverless
L'incorporamento dei modelli è un componente fondamentale dei sistemi di raccomandazione moderni, in particolare nella fase di recupero in cui consentono una ricerca efficiente di somiglianza in milioni di elementi. Mentre il modello a due torre genera incorporamenti specifici dell'attività, i modelli di incorporamento con training preliminare possono essere ottimizzati per applicazioni specifiche del dominio per migliorare la qualità del recupero.
Il notebook di esempio seguente illustra come usare l'apprendimento contrastivo per ottimizzare un modello di incorporamento in stile BERT in un ambiente di calcolo GPU serverless (SGC). Usa il framework llm-foundry con il formatore di Composer per ottimizzare modelli come gte-large-en-v1.5, usando i dati archiviati nelle tabelle Delta. Questo esempio usa Mosaic Streaming per convertire i dati in formato MDS (Mosaic Data Shard) per il caricamento dei dati distribuiti e MLflow per il rilevamento e la registrazione dei modelli.
Ottimizzare il notebook del modello di incorporamento
Annotazioni
- Il modello di incorporamento prevede dati con colonne per
query_text,positive_passagee facoltativamentenegative_passages. - Gli incorporamenti ottimizzati possono essere usati negli archivi vettoriali per operazioni di ricerca di somiglianza, consentendo un recupero efficiente degli elementi pertinenti per i sistemi di raccomandazione.
- Questo approccio è particolarmente utile quando è necessario adattare un modello di incorporamento per utilizzo generico al dominio o al caso d'uso specifico.