Esercitazione: Creare un consigliatore di film usando la fattorizzazione della matrice con ML.NET

Questa esercitazione illustra come creare un strumento di raccomandazione per film con ML.NET in un'applicazione console .NET. I passaggi usano C# e Visual Studio 2019.

In questa esercitazione si apprenderà come:

Selezionare un algoritmo di Machine Learning
Preparare e caricare i dati
Compilare ed eseguire il training di un modello
Valutare un modello
Distribuire e usare un modello

Il codice sorgente per questa esercitazione è disponibile nel repository dotnet/samples .

Flusso di lavoro di Machine Learning

Per eseguire l'attività verranno usati i passaggi seguenti, nonché qualsiasi altra attività ML.NET:

Caricare i dati
Compilare ed eseguire il training del modello
Valutare il modello
Usare il modello

Prerequisiti

Visual Studio 2022 o versione successiva.

Selezionare l'attività di Machine Learning appropriata

Esistono diversi modi per affrontare i problemi di raccomandazione, ad esempio consigliare un elenco di film o consigliare un elenco di prodotti correlati, ma in questo caso si stima quale valutazione (1-5) un utente darà a un determinato film e consiglia tale film se è superiore a una soglia definita (maggiore è la valutazione, maggiore è la probabilità di un utente che gradirà un determinato film).

Creare un'applicazione console

Creare un progetto

Creare un'applicazione console C# denominata "MovieRecommender". Fare clic sul pulsante Avanti.
Scegliere .NET 8 come framework da usare. Fare clic sul pulsante Crea.
Creare una directory denominata Data nel progetto per archiviare il set di dati:

In Esplora soluzioni fare clic con il pulsante destro del mouse sul progetto e scegliere Aggiungi>nuova cartella. Digitare "Data" e selezionare Invio.
Installare i pacchetti NuGet di Microsoft.ML e Microsoft.ML.Recommender :

Annotazioni

In questo esempio viene usata la versione stabile più recente dei pacchetti NuGet menzionati, a meno che non diversamente specificato.

In Esplora soluzioni fare clic con il pulsante destro del mouse sul progetto e scegliere Gestisci pacchetti NuGet. Scegliere "nuget.org" come origine pacchetto, selezionare la scheda Sfoglia , cercare Microsoft.ML, selezionare il pacchetto nell'elenco e selezionare Installa. Selezionare il pulsante OK nella finestra di dialogo Anteprima modifiche e quindi selezionare il pulsante Accetto nella finestra di dialogo Accettazione della licenza se si accettano le condizioni di licenza per i pacchetti elencati. Ripetere questi passaggi per Microsoft.ML.Recommender.

Aggiungere le direttive seguenti using all'inizio del file Program.cs :

using Microsoft.ML;
using Microsoft.ML.Trainers;
using MovieRecommendation;

Scarica i tuoi dati

Scaricare i due set di dati e salvarli nella cartella Dati creata in precedenza:
- Fare clic con il pulsante destro del mouse su recommendation-ratings-train.csv e selezionare "Salva collegamento (o Destinazione) con nome..."
- Fare clic con il pulsante destro del mouse su recommendation-ratings-test.csv e selezionare "Salva collegamento (o Destinazione) con nome..."
  
  Assicurarsi di salvare i file *.csv nella cartella Dati o dopo averlo salvato altrove, spostare i file *.csv nella cartella Dati .
In Esplora soluzioni fare clic con il pulsante destro del mouse su ognuno dei file *.csv e scegliere Proprietà. Nella sezione Avanzate, cambiare il valore di Copia nella directory di output con Copia se più recente.

Caricare i dati

Il primo passaggio del processo di ML.NET consiste nel preparare e caricare i dati di training e test del modello.

I dati delle valutazioni sono suddivisi in Train e Test insiemi di dati. I Train dati vengono usati per adattare il modello. I Test dati vengono usati per eseguire stime con il modello sottoposto a training e valutare le prestazioni del modello. È comune avere una divisione di 80/20 con Train i dati e Test .

Di seguito è riportata un'anteprima dei dati dei file *.csv:

Screenshot dell'anteprima del set di dati CVS.

Nei file *.csv sono presenti quattro colonne:

userId
movieId
rating
timestamp

In Machine Learning, le colonne usate per eseguire una stima sono denominate Funzionalità e la colonna con la stima restituita è denominata Etichetta.

Si vogliono stimare le classificazioni dei film, quindi la colonna di classificazione è .Label Le altre tre colonne, userId, movieIde timestamp vengono tutte Features usate per stimare .Label

Funzionalità	Etichetta
`userId`	`rating`
`movieId`
`timestamp`

Spetta all'utente decidere quali Features vengono usati per stimare l'oggetto Label. È anche possibile usare metodi come l'importanza della funzionalità di permutazione per facilitare la selezione del migliore Features.

In questo caso, è consigliabile eliminare la timestamp colonna come valore Feature perché il timestamp non influisce realmente sul modo in cui un utente classifica un determinato film e pertanto non contribuirà a eseguire una stima più accurata:

Funzionalità	Etichetta
`userId`	`rating`
`movieId`

Successivamente è necessario definire la struttura dei dati per la classe di input.

Aggiungere una nuova classe al progetto:

In Esplora soluzioni fare clic con il pulsante destro del mouse sul progetto e quindi scegliere Aggiungi > nuovo elemento.
Nella finestra di dialogo Aggiungi nuovo elemento selezionare Classe e modificare il campo Nome in MovieRatingData.cs. Quindi selezionare Aggiungi.

Il file MovieRatingData.cs viene aperto nell'editor di codice. Aggiungere la direttiva seguente using all'inizio di MovieRatingData.cs:

using Microsoft.ML.Data;

Creare una classe chiamata MovieRating rimuovendo la definizione di classe esistente e aggiungendo il codice seguente in MovieRatingData.cs:

public class MovieRating
{
    [LoadColumn(0)]
    public float userId;
    [LoadColumn(1)]
    public float movieId;
    [LoadColumn(2)]
    public float Label;
}

MovieRating specifica una classe di dati di input. L'attributo LoadColumn specifica le colonne (in base all'indice di colonna) nel set di dati da caricare. Le colonne userId e movieId sono i tuoi Features (gli input che verranno assegnati al modello per prevedere il Label), e la colonna di valutazione è l'Label che verrà previsto (l'output del modello).

Creare un'altra classe, MovieRatingPrediction, per rappresentare i risultati stimati aggiungendo il codice seguente dopo la MovieRating classe in MovieRatingData.cs:

public class MovieRatingPrediction
{
    public float Label;
    public float Score;
}

In Program.cs sostituire con Console.WriteLine("Hello World!") il codice seguente:

MLContext mlContext = new MLContext();

La classe MLContext è un punto di partenza per tutte le operazioni di ML.NET e l'inizializzazione mlContext crea un nuovo ambiente ML.NET che può essere condiviso tra gli oggetti del flusso di lavoro di creazione del modello. È simile, concettualmente, a DBContext in Entity Framework.

Nella parte inferiore del file creare un metodo denominato LoadData():

(IDataView training, IDataView test) LoadData(MLContext mlContext)
{

}

Annotazioni

Questo metodo restituirà un errore fino a quando non si aggiunge un'istruzione return nei passaggi seguenti.

Inizializza le variabili del percorso dati, carica i dati dai file *.csv e restituisci i dati Train e Test come oggetti IDataView aggiungendo quanto segue come la riga successiva di codice in LoadData():

var trainingDataPath = Path.Combine(Environment.CurrentDirectory, "Data", "recommendation-ratings-train.csv");
var testDataPath = Path.Combine(Environment.CurrentDirectory, "Data", "recommendation-ratings-test.csv");

IDataView trainingDataView = mlContext.Data.LoadFromTextFile<MovieRating>(trainingDataPath, hasHeader: true, separatorChar: ',');
IDataView testDataView = mlContext.Data.LoadFromTextFile<MovieRating>(testDataPath, hasHeader: true, separatorChar: ',');

return (trainingDataView, testDataView);

I dati in ML.NET sono rappresentati come interfaccia IDataView. IDataView è un modo flessibile ed efficiente di descrivere i dati tabulari (numerici e di testo). I dati possono essere caricati da un file di testo o in tempo reale (ad esempio, file di database SQL o di log) a un IDataView oggetto .

LoadFromTextFile() definisce lo schema dei dati e legge nel file. Accetta le variabili del percorso dati e restituisce un oggetto IDataView. In questo caso, si specifica il percorso per i Test file e Train e si indicano sia l'intestazione del file di testo (in modo che possano usare correttamente i nomi di colonna) che il separatore di dati dei caratteri virgola (il separatore predefinito è una scheda).

Aggiungere il codice seguente per chiamare il LoadData() metodo e restituire i Train dati e Test :

(IDataView trainingDataView, IDataView testDataView) = LoadData(mlContext);

Compilare ed eseguire il training del modello

Creare il BuildAndTrainModel() metodo subito dopo il LoadData() metodo usando il codice seguente:

ITransformer BuildAndTrainModel(MLContext mlContext, IDataView trainingDataView)
{

}

Annotazioni

Questo metodo restituirà un errore fino a quando non si aggiunge un'istruzione return nei passaggi seguenti.

Definire le trasformazioni dei dati aggiungendo il codice seguente a BuildAndTrainModel():

IEstimator<ITransformer> estimator = mlContext.Transforms.Conversion.MapValueToKey(outputColumnName: "userIdEncoded", inputColumnName: "userId")
    .Append(mlContext.Transforms.Conversion.MapValueToKey(outputColumnName: "movieIdEncoded", inputColumnName: "movieId"));

Poiché userId e movieId rappresentano utenti e titoli di film, non valori reali, si usa il metodo MapValueToKey() per trasformare ognuno di essi userId in movieId una colonna di tipo chiave Feature numerica (un formato accettato dagli algoritmi di raccomandazione) e aggiungerli come nuove colonne del set di dati:

userId	movieId	Etichetta	userIdEncoded	movieIdEncoded
1	1	4	userKey1	movieKey1
1	3	4	userKey1	movieKey2
1	6	4	userKey1	movieKey3

Scegliere l'algoritmo di Machine Learning e aggiungerlo alle definizioni di trasformazione dei dati aggiungendo quanto segue come riga di codice successiva in BuildAndTrainModel():

var options = new MatrixFactorizationTrainer.Options
{
    MatrixColumnIndexColumnName = "userIdEncoded",
    MatrixRowIndexColumnName = "movieIdEncoded",
    LabelColumnName = "Label",
    NumberOfIterations = 20,
    ApproximationRank = 100
};

var trainerEstimator = estimator.Append(mlContext.Recommendation().Trainers.MatrixFactorization(options));

MatrixFactorizationTrainer è l'algoritmo di training consigliato. La factorizzazione matrice è un approccio comune alle raccomandazioni quando si hanno dati su come gli utenti hanno valutato i prodotti in passato, che è il caso per i set di dati in questa esercitazione. Esistono altri algoritmi di raccomandazione per quando sono disponibili dati diversi (vedere la sezione Altri algoritmi di raccomandazione di seguito per altre informazioni).

In questo caso, l'algoritmo Matrix Factorization usa un metodo denominato "filtro collaborativo", che presuppone che se l'utente 1 ha la stessa opinione dell'utente 2 su un determinato problema, è più probabile che l'utente 1 abbia la stessa probabilità che l'utente 2 abbia un problema diverso.

Ad esempio, se l'utente 1 e l'utente 2 valutano i film in modo analogo, l'utente 2 è più probabile che goda di un film che l'utente 1 abbia guardato e valutato altamente:

	`Incredibles 2 (2018)`	`The Avengers (2012)`	`Guardians of the Galaxy (2014)`
Utente 1	Guardare e mi è piaciuto il film	Guardare e mi è piaciuto il film	Guardare e mi è piaciuto il film
Utente 2	Guardare e mi è piaciuto il film	Guardare e mi è piaciuto il film	Non ha guardato - CONSIGLIA film

Il Matrix Factorization formatore ha diverse opzioni, che è possibile leggere di più nella sezione Iperparametri algoritmo di seguito.

Adattare il modello ai Train dati e restituire il modello sottoposto a training aggiungendo quanto segue come riga di codice successiva nel BuildAndTrainModel() metodo :

Console.WriteLine("=============== Training the model ===============");
ITransformer model = trainerEstimator.Fit(trainingDataView);

return model;

Il metodo Fit() esegue il training del modello con il set di dati di training fornito. Tecnicamente, esegue le Estimator definizioni trasformando i dati e applicando il training e restituisce il modello sottoposto a training, ovvero .Transformer

Per altre informazioni sul flusso di lavoro di training del modello in ML.NET, vedere Che cos'è ML.NET e come funziona?.

Aggiungere quanto segue come riga di codice successiva sotto la chiamata al metodo per chiamare il LoadData()BuildAndTrainModel() metodo e restituire il modello sottoposto a training:

ITransformer model = BuildAndTrainModel(mlContext, trainingDataView);

Valutare il modello

Dopo aver eseguito il training del modello, usare i dati di test per valutare le prestazioni del modello.

Creare il EvaluateModel() metodo subito dopo il BuildAndTrainModel() metodo usando il codice seguente:

void EvaluateModel(MLContext mlContext, IDataView testDataView, ITransformer model)
{

}

Trasformare i Test dati aggiungendo il codice seguente a EvaluateModel():

Console.WriteLine("=============== Evaluating the model ===============");
var prediction = model.Transform(testDataView);

Il metodo Transform() esegue stime per più righe di input fornite di un set di dati di test.

Valutare il modello aggiungendo quanto segue come riga di codice successiva nel EvaluateModel() metodo :

var metrics = mlContext.Regression.Evaluate(prediction, labelColumnName: "Label", scoreColumnName: "Score");

Dopo aver impostato la stima, il metodo Evaluate() valuta il modello, che confronta i valori stimati con l'effettivo Labels nel set di dati di test e restituisce le metriche sulle prestazioni del modello.

Stampare le metriche di valutazione nella console aggiungendo quanto segue come riga di codice successiva nel EvaluateModel() metodo :

Console.WriteLine("Root Mean Squared Error : " + metrics.RootMeanSquaredError.ToString());
Console.WriteLine("RSquared: " + metrics.RSquared.ToString());

Aggiungere quanto segue come riga di codice successiva sotto la chiamata al metodo per chiamare il BuildAndTrainModel()EvaluateModel() metodo :

EvaluateModel(mlContext, testDataView, model);

L'output finora dovrebbe essere simile al testo seguente:

=============== Training the model ===============
iter      tr_rmse          obj
   0       1.5403   3.1262e+05
   1       0.9221   1.6030e+05
   2       0.8687   1.5046e+05
   3       0.8416   1.4584e+05
   4       0.8142   1.4209e+05
   5       0.7849   1.3907e+05
   6       0.7544   1.3594e+05
   7       0.7266   1.3361e+05
   8       0.6987   1.3110e+05
   9       0.6751   1.2948e+05
  10       0.6530   1.2766e+05
  11       0.6350   1.2644e+05
  12       0.6197   1.2541e+05
  13       0.6067   1.2470e+05
  14       0.5953   1.2382e+05
  15       0.5871   1.2342e+05
  16       0.5781   1.2279e+05
  17       0.5713   1.2240e+05
  18       0.5660   1.2230e+05
  19       0.5592   1.2179e+05
=============== Evaluating the model ===============
Rms: 0.994051469730769
RSquared: 0.412556298844873

In questo output sono presenti 20 iterazioni. In ogni iterazione, la misura dell'errore diminuisce e converge più vicino a 0.

( root of mean squared error RMS o RMSE) viene usato per misurare le differenze tra i valori stimati del modello e i valori osservati dal set di dati di test. Tecnicamente è la radice quadrata della media dei quadrati degli errori. Più basso è, meglio è il modello.

R Squared indica il modo in cui i dati sono adatti a un modello. È compreso tra 0 e 1. Il valore 0 indica che i dati sono casuali o altrimenti non possono essere adatti al modello. Il valore 1 indica che il modello corrisponde esattamente ai dati. Si vuole che il R Squared punteggio sia il più vicino possibile a 1.

La creazione di modelli riusciti è un processo iterativo. Questo modello ha una qualità inferiore iniziale perché l'esercitazione usa set di dati di piccole dimensioni per fornire un training rapido del modello. Se non si è soddisfatti della qualità del modello, è possibile provare a migliorarlo fornendo set di dati di training più grandi o scegliendo algoritmi di training diversi con iper parametri diversi per ogni algoritmo. Per altre informazioni, vedere la sezione Migliorare il modello di seguito.

Utilizzare il modello

È ora possibile usare il modello sottoposto a training per eseguire stime sui nuovi dati.

Creare il UseModelForSinglePrediction() metodo subito dopo il EvaluateModel() metodo usando il codice seguente:

void UseModelForSinglePrediction(MLContext mlContext, ITransformer model)
{

}

PredictionEngine Usare per stimare la classificazione aggiungendo il codice seguente a UseModelForSinglePrediction():

Console.WriteLine("=============== Making a prediction ===============");
var predictionEngine = mlContext.Model.CreatePredictionEngine<MovieRating, MovieRatingPrediction>(model);

PredictionEngine è un'API utile che consente di eseguire una stima su una singola istanza di dati. PredictionEngine non è thread-safe. È accettabile usare in ambienti a thread singolo o prototipo. Per migliorare le prestazioni e la sicurezza dei thread negli ambienti di produzione, usa il PredictionEnginePool servizio, che crea un elenco di oggetti ObjectPoolPredictionEngine da utilizzare in tutta l'applicazione. Vedere questa guida su come usare PredictionEnginePool in un'API Web di ASP.NET Core.

Annotazioni

PredictionEnginePool l'estensione del servizio è attualmente in anteprima.

Creare un'istanza di MovieRating chiamata testInput e passarla al motore di stima aggiungendo quanto segue come righe di codice successive nel UseModelForSinglePrediction() metodo :

var testInput = new MovieRating { userId = 6, movieId = 10 };

var movieRatingPrediction = predictionEngine.Predict(testInput);

La funzione Predict() esegue una stima su una singola colonna di dati.

È quindi possibile usare la Scoreclassificazione stimata o per determinare se si vuole consigliare il film con movieId 10 all'utente 6. Maggiore è , Scoremaggiore è la probabilità che un utente gradisa un determinato film. In questo caso, si supponga di consigliare film con una valutazione stimata di > 3,5.

Per stampare i risultati, aggiungere quanto segue come righe di codice successive nel UseModelForSinglePrediction() metodo :

if (Math.Round(movieRatingPrediction.Score, 1) > 3.5)
{
    Console.WriteLine("Movie " + testInput.movieId + " is recommended for user " + testInput.userId);
}
else
{
    Console.WriteLine("Movie " + testInput.movieId + " is not recommended for user " + testInput.userId);
}

Aggiungere quanto segue come riga di codice successiva dopo la chiamata al metodo per chiamare il EvaluateModel()UseModelForSinglePrediction() metodo :

UseModelForSinglePrediction(mlContext, model);

L'output di questo metodo dovrebbe essere simile al testo seguente:

=============== Making a prediction ===============
Movie 10 is recommended for user 6

Salvare il modello

Per usare il modello per eseguire stime nelle applicazioni degli utenti finali, è prima necessario salvare il modello.

Creare il SaveModel() metodo subito dopo il UseModelForSinglePrediction() metodo usando il codice seguente:

void SaveModel(MLContext mlContext, DataViewSchema trainingDataViewSchema, ITransformer model)
{

}

Salvare il modello sottoposto a training aggiungendo il codice seguente nel SaveModel() metodo :

var modelPath = Path.Combine(Environment.CurrentDirectory, "Data", "MovieRecommenderModel.zip");

Console.WriteLine("=============== Saving the model to a file ===============");
mlContext.Model.Save(model, trainingDataViewSchema, modelPath);

Questo metodo salva il modello sottoposto a training in un file di .zip (nella cartella "Dati"), che può quindi essere usato in altre applicazioni .NET per eseguire stime.

Aggiungere quanto segue come riga di codice successiva dopo la chiamata al metodo per chiamare il UseModelForSinglePrediction()SaveModel() metodo :

SaveModel(mlContext, trainingDataView.Schema, model);

Usare il modello salvato

Dopo aver salvato il modello sottoposto a training, è possibile utilizzare il modello in ambienti diversi. Vedere Salvare e caricare modelli sottoposti a training per informazioni su come rendere operativo un modello di Machine Learning con training nelle app.

Results

Dopo aver seguito i passaggi precedenti, eseguire l'app console (CTRL+F5). I risultati della singola stima precedente dovrebbero essere simili ai seguenti. È possibile che vengano visualizzati avvisi o messaggi di elaborazione, ma questi messaggi sono stati rimossi dai risultati seguenti per maggiore chiarezza.

=============== Training the model ===============
iter      tr_rmse          obj
   0       1.5382   3.1213e+05
   1       0.9223   1.6051e+05
   2       0.8691   1.5050e+05
   3       0.8413   1.4576e+05
   4       0.8145   1.4208e+05
   5       0.7848   1.3895e+05
   6       0.7552   1.3613e+05
   7       0.7259   1.3357e+05
   8       0.6987   1.3121e+05
   9       0.6747   1.2949e+05
  10       0.6533   1.2766e+05
  11       0.6353   1.2636e+05
  12       0.6209   1.2561e+05
  13       0.6072   1.2462e+05
  14       0.5965   1.2394e+05
  15       0.5868   1.2352e+05
  16       0.5782   1.2279e+05
  17       0.5713   1.2227e+05
  18       0.5637   1.2190e+05
  19       0.5604   1.2178e+05
=============== Evaluating the model ===============
Rms: 0.977175077487166
RSquared: 0.43233349213192
=============== Making a prediction ===============
Movie 10 is recommended for user 6
=============== Saving the model to a file ===============

Congratulazioni! A questo punto è stato creato un modello di Machine Learning per consigliare film. Il codice sorgente per questa esercitazione è disponibile nel repository dotnet/samples .

Migliorare il modello

Esistono diversi modi per migliorare le prestazioni del modello in modo da ottenere stime più accurate.

Data

L'aggiunta di altri dati di addestramento con campioni sufficienti per ogni utente e ID del film può contribuire a migliorare la qualità del modello di raccomandazione.

La convalida incrociata è una tecnica per la valutazione dei modelli che suddivide in modo casuale i dati in subset (anziché estrarre dati di test dal set di dati come in questa esercitazione) e accetta alcuni dei gruppi come dati di training e alcuni dei gruppi come dati di test. Questo metodo supera le prestazioni di una suddivisione dei test di training in termini di qualità del modello.

Funzionalità

In questa esercitazione si usano solo i tre Features (user id, movie ide rating) forniti dal set di dati.

Anche se si tratta di un buon punto di partenza, in realtà è possibile aggiungere altri attributi o Features (ad esempio età, sesso, posizione geografica e così via) se sono inclusi nel set di dati. L'aggiunta di elementi più pertinenti Features consente di migliorare le prestazioni del modello di raccomandazione.

Se non si è certi di quale Features potrebbe essere la più rilevante per l'attività di Machine Learning, è anche possibile usare calcolo del contributo delle funzionalità (FCC) e l'importanza della funzionalità di permutazione, che ML.NET fornisce per scoprire l'elemento più influente Features.

Iperparametri degli algoritmi

Mentre ML.NET fornisce algoritmi di training predefiniti validi, è possibile ottimizzare ulteriormente le prestazioni modificando gli iperparametri dell'algoritmo.

Per Matrix Factorization, è possibile sperimentare con iperparametri, ad esempio NumberOfIterations e ApprossimazioneRank per verificare se ciò offre risultati migliori.

In questa esercitazione, ad esempio, le opzioni dell'algoritmo sono:

var options = new MatrixFactorizationTrainer.Options
{
    MatrixColumnIndexColumnName = "userIdEncoded",
    MatrixRowIndexColumnName = "movieIdEncoded",
    LabelColumnName = "Label",
    NumberOfIterations = 20,
    ApproximationRank = 100
};

Altri algoritmi di raccomandazione

L'algoritmo di fattorizzazione della matrice con filtro collaborativo è un solo approccio per l'esecuzione di raccomandazioni sui film. In molti casi, è possibile che i dati delle valutazioni non siano disponibili e che la cronologia dei film sia disponibile solo dagli utenti. In altri casi, è possibile che si disponga di più dei soli dati di valutazione dell'utente.

Algoritmo	Scenario	Sample
Factorizzazione di una matrice di classi	Usa questa opzione solo quando hai solo userId e movieId. Questo stile di raccomandazione si basa sullo scenario di co-acquisto o sui prodotti acquistati frequentemente insieme, il che significa che consiglia ai clienti un set di prodotti in base alla propria cronologia degli ordini di acquisto.	>Provalo
Macchine a fattorizzazione con riconoscimento dei campi	Usare questa opzione per fare raccomandazioni quando si dispone di più funzionalità oltre userId, productId e valutazione (ad esempio la descrizione del prodotto o il prezzo del prodotto). Questo metodo usa anche un approccio di filtro collaborativo.	>Provalo

Nuovo scenario utente

Un problema comune nel filtro collaborativo è il problema di avvio a freddo, ovvero quando si ha un nuovo utente senza dati precedenti da cui trarre inferenze. Questo problema viene spesso risolto chiedendo ai nuovi utenti di creare un profilo e, ad esempio, valutare i film che hanno visto in passato. Anche se questo metodo comporta un sovraccarico per l'utente, fornisce alcuni dati di partenza per i nuovi utenti senza cronologia di classificazione.

Risorse

I dati usati in questa esercitazione sono derivati dal set di dati MovieLens.

Passaggi successivi

In questo tutorial, hai imparato come:

Selezionare un algoritmo di Machine Learning
Preparare e caricare i dati
Compilare ed eseguire il training di un modello
Valutare un modello
Distribuire e usare un modello

Avanza all'esercitazione successiva per saperne di più

Analisi del sentiment

Commenti e suggerimenti

Questa pagina è stata utile?

Last updated on 2025-12-06

Esercitazione: Creare un consigliatore di film usando la fattorizzazione della matrice con ML.NET

Flusso di lavoro di Machine Learning

Prerequisiti

Selezionare l'attività di Machine Learning appropriata

Creare un'applicazione console

Creare un progetto

Scarica i tuoi dati

Caricare i dati

Compilare ed eseguire il training del modello

Valutare il modello

Utilizzare il modello

Salvare il modello

Usare il modello salvato

Results

Migliorare il modello

Data

Funzionalità

Iperparametri degli algoritmi

Altri algoritmi di raccomandazione

Nuovo scenario utente

Risorse

Passaggi successivi

Commenti e suggerimenti

Risorse aggiuntive