Sortieren und Filtern von Daten
Wir analysieren Daten, um eine geschäftliche Frage zu beantworten oder eine Geschichte in den Daten zu finden. Das Sortieren und Filtern von Daten hilft Ihnen dabei. Wie viele Verkäufe wurden zum Beispiel am Montag im Store in New York getätigt? Oder wie viele Pakete wurden am Freitag aus dem Lager geliefert?
Durch das Filtern werden Zeilen aus dem Resultset ausgeschlossen, die nicht die Frage beantworten, die wir stellen. Wenn wir alle Stores außer New York herausfiltern, können wir die Ergebnisse anhand eines kleineren Datensatzes analysieren und zählen, wie viele Verkäufe getätigt wurden. Wir können nach jeder Spalte in einem Dataset filtern, unabhängig von der Art der Daten in dieser Spalte.
Durch Sortieren des Datasets können wir den höchsten oder niedrigsten Wert innerhalb einer Spalte finden. Die Sortierung kann für jeden Datentyp durchgeführt werden, häufig jedoch für ein Datum oder eine Zahl, um eine Frage zu beantworten, z. B. die höchste Anzahl von Verkäufen. Zeichenfolgedaten können alphabetisch in aufsteigender oder absteigender Reihenfolge sortiert werden.
Ausreißer sind Werte, die im Vergleich zu den anderen Werten des Datasets ungewöhnlich hoch oder niedrig sind. Wenn ein Ausreißer in eine Aggregatfunktion, wie z. B. einen Durchschnitt, einbezogen wird, kann dies zu irreführenden Ergebnissen führen.
In diesem Video sehen Sie, wie ein Dataset gefiltert werden kann, um eine Frage zu beantworten, und wie Spalten sortiert werden können, um die höchsten und niedrigsten Werte innerhalb eines Bereichs zu ermitteln: