Erste Schritte mit Daten

Abgeschlossen

Ein Dataset ist eine Sammlung von Daten, die in Zeilen und Spalten organisiert sind, oft auch als Tabelle bezeichnet. Zeilen werden auch als Datensätze und Spalten als Felder bezeichnet. Datenpunkte sind die Felder in einem Dataset, die in der Regel verschiedene Arten von Daten enthalten:

  • Temporale Daten – Temporale Daten werden an einem Ereignis gehalten, z. B. wenn eine Bestellung platziert wurde oder ein Paket gesendet wurde. Datumsangaben haben eine natürliche Reihenfolge, und wir wissen, dass der 24.12.2021 vor dem 25.12.2021 und nach dem 23.12.2021 liegt. Aufgrund dieser natürlichen Reihenfolge ist es einfach, Werte im Laufe der Zeit zu messen.

  • Zeichenfolgendaten – Ein Textwert wird auch als Zeichen- oder Zeichenfolgedaten bezeichnet und wird oft als kategorische Daten eingestuft. Dies liegt daran, dass sie Kategorien von Datensätzen innerhalb des Datasets beschreibt. Der Name eines Mitarbeiters wird beispielsweise als Zeichenfolgendaten gespeichert.

  • Numerische Daten – Numerische Daten oder Zahlen können entweder als fortlaufend oder diskret klassifiziert werden. Kontinuierliche Daten sind etwas, das wir auf einer Skala messen, und diskrete Daten sind Werte, die gezählt und nicht gemessen werden. Abhängig von den Werten in einer numerischen Spalte kann dieser Typ als Kategorie verwendet werden.

Es ist wichtig, dass Sie die Daten in Ihrem Dataset verstehen, bevor Sie sie analysieren. Anschließend können Sie die richtigen analytischen Funktionen auswählen, die auf die Typen von Daten angewendet werden, mit der Sie arbeiten.

In diesem Video sehen Sie ein Beispiel für ein Dataset und wie die verschiedenen Arten von Datums-, Zeichenfolgen- und numerischen Feldern in Zeilen und Spalten kombiniert werden. Sie erfahren, wie die Analyse in einem Dataset ausgeführt werden kann, um Muster innerhalb der Daten zu verstehen: