Introduzione ai dati

Completato

Un set di dati è una raccolta di dati organizzati in righe e colonne, spesso denominata tabella. Le righe sono note anche come record e le colonne come campi. I punti dati costituiscono i campi in un set di dati e in genere comprendono tipi diversi di dati:

  • Dati temporali - I dati temporali sono date correlate a un evento, ad esempio quando è stato effettuato un ordine o è stato spedito un pacco. Le date hanno un ordine naturale, e si sa che il 24/12/2021 viene prima del 25/12/2021 e dopo il 23/12/2021. Grazie a questo ordine naturale, è facile misurare i valori nel tempo.

  • Dati di tipo stringa - I valori di testo vengono anche definiti dati di tipo carattere o stringa e vengono spesso classificati come dati categorici. Tali dati descrivono le categorie di record all'interno del set di dati. Il nome di un dipendente, ad esempio, viene archiviato come dati di tipo stringa.

  • Dati numerici - I dati numerici, o numeri, possono essere classificati come continui o discreti. I dati continui possono essere misurati lungo una scala e i dati discreti sono valori che vengono conteggiati piuttosto che misurati. A seconda dei valori in una colonna numerica, questo tipo può essere usato come categoria.

È importante comprendere i dati nel set di dati prima di analizzarli. Sarà quindi possibile scegliere le funzioni di analisi appropriate da applicare ai tipi di dati usati.

Questo video illustra un esempio di set di dati e spiega come i diversi tipi di campi di data, stringa e numerici si combinano in righe e colonne. Si apprenderà come eseguire l'analisi su un set di dati per comprendere i modelli contenuti nei dati: