Questo browser non è più supportato.
Esegui l'aggiornamento a Microsoft Edge per sfruttare i vantaggi di funzionalità più recenti, aggiornamenti della sicurezza e supporto tecnico.
Perché è necessario pulire i dati prima del training?
La rimozione di righe di dati aumenta la potenza del modello
La pulizia dei dati consente di selezionare le caratteristiche che consentiranno di migliorare le prestazioni del modello
La rimozione di righe con errori impedisce che queste righe traggano in inganno il processo di training
Su quale tipologia di dati funziona meglio la codifica con vettori one-hot?
Dati ordinali
Dati categorici con due valori possibili
Dati categorici con tre o più valori
Che cos'è un campione di dati? Che cos'è una popolazione?
Un campione è costituito da tutti i dati possibili ritenuti importanti. Una popolazione è il subset di dati effettivamente disponibili
Sia la popolazione che il campione fanno riferimento ai dati usati per eseguire il training del modello.
Una popolazione è costituita da tutti i dati possibili ritenuti importanti. Un campione è il subset di tali dati effettivamente disponibili.
Si dispone di un modello che non funziona correttamente. Quale di queste soluzioni non aiuterà sicuramente a migliorarne le prestazioni?
Aggiunta di ulteriori cambioni (righe)
L'aggiunta di un numero ridotto di caratteristiche (colonne) che si sa essere correlate a ciò che il modello sta tentando di prevedere
L'aggiunta di un numero elevato di caratteristiche che si sa non avere alcuna relazione con ciò che il modello sta tentando di prevedere.
Devi rispondere a tutte le domande prima di controllare il lavoro svolto.
Continua
Questa pagina è stata utile?