Übung: Analysieren von Daten

Abgeschlossen

Wenden wir nun einige der vorgestellten Prinzipien und Techniken der Datenanalyse in der Praxis an. In diesem Lab verwenden Sie Excel Online, um Daten zu analysieren und zu visualisieren.

Sie werden Rosies Limonadenverkäufe analysieren und Visualisierungen erstellen, die Ihnen dabei helfen, Erkenntnisse aus den Daten zu gewinnen.

Vorbereitung

Hinweis

Wenn Sie das vorangehende Modul in diesem Lernpfad bereits bearbeitet haben, können Sie den Abschnitt Bevor Sie beginnen überspringen.

Wenn Sie noch kein Microsoft-Konto haben (z. B. ein hotmail.com-, live.com- oder outlook.com-Konto), registrieren Sie sich unter https://signup.live.com für ein Konto.

Hochladen der Arbeitsmappe auf OneDrive

  1. Navigieren Sie in Ihrem Webbrowser zu https://onedrive.live.com, und melden Sie sich mit den Anmeldeinformationen für Ihr Microsoft-Konto an. Die Dateien und Ordner in Ihrem OneDrive-Ordner sollten wie folgt angezeigt werden:

    Screenshot of One Drive My Files folder.

  2. Wählen Sie im Menü + Neu die Option Ordner aus, um einen neuen Ordner zu erstellen. Sie können den Ordner beliebig benennen, zum Beispiel als DAT101. Wenn Ihr neuer Ordner angezeigt wird, wählen Sie ihn aus, um ihn zu öffnen.

  3. Klicken Sie in Ihrem neuen leeren Ordner im Menü ⤒ Upload auf Dateien. Geben Sie dann bei Aufforderung im Feld Dateiname die folgende Adresse ein (Sie können sie von hier aus kopieren und einfügen):

    https://github.com/MicrosoftLearning/mslearn-data-concepts/raw/main/labfiles/Lemonade.xlsx
    

    Klicken Sie dann auf Öffnen, um die Excel-Datei mit Rosies Limonadendaten hochzuladen, wie hier gezeigt:

    Screenshot of uploading a file to One Drive.

    Nach ein paar Sekunden sollte die Datei Lemonade.xlsx wie folgt in Ihrem Ordner angezeigt werden:

    Screenshot of Lemonade x l s x file in One Drive.

Öffnen der Arbeitsmappe in Excel Online

  1. Klicken Sie auf die Datei Lemonade.xlsx in Ihrem OneDrive-Ordner, um sie in Excel Online zu öffnen. Nach dem Öffnen sollte die Datei wie folgt aussehen:

    Screenshot of Lemonade workbook in Excel.

  2. Die Datumswerte in der Spalte A sind möglicherweise zu breit, um angezeigt zu werden, sodass die Zellen wie oben dargestellt Nummernzeichen (#######) enthalten können. Doppelklicken Sie in diesem Fall auf die Linie zwischen den Spaltenüberschriften A und B, um die Datumswerte anzuzeigen. Die Datumswerte werden nun im Format des Gebietsschemas angezeigt, das Ihrem Microsoft-Konto zugeordnet ist. In der folgenden Abbildung werden die Datumsangaben z. B. im UK-Format (dd/MM/yyyyy) angezeigt.

    Screenshot of column A widened to show dates.

Übung 1: Analysieren von Daten mit einer PivotTable

PivotTables sind eine hervorragende Möglichkeit, um Datenschnitte und Datenwürfel (Slice & Dice) zu erstellen und dabei numerische Measures nach einer oder mehreren Dimensionen zusammenzufassen. In dieser Übung werden Sie eine PivotTable verwenden, um die auf verschiedene Weise aggregierten Limonadendaten anzuzeigen.

Erstellen einer PivotTable

  1. Sofern nicht bereits geschehen, navigieren Sie in Ihrem Webbrowser zu https://onedrive.live.com, und melden Sie sich mit den Anmeldeinformationen für Ihr Microsoft-Konto an. Öffnen Sie dann die Arbeitsmappe Lemonade.xlsx in dem Ordner, in den Sie die Datei im Abschnitt Bevor Sie beginnen hochgeladen haben. Ihre Arbeitsmappe sollte wie folgt aussehen:

    Screenshot of Lemonade workbook in Excel Online.

  2. Wählen Sie eine beliebige Zelle in der Datentabelle aus, klicken Sie auf der Registerkarte Einfügen des Menübands auf PivotTable, und erstellen Sie in einem neuen Arbeitsblatt eine PivotTable aus Ihrer Datentabelle. Excel fügt ein neues Arbeitsblatt mit einer PivotTable hinzu, die wie folgt aussieht:

    Screenshot of an empty Pivot Table in Excel Online.

  3. Wählen Sie im Bereich PivotTable-Felder die Option Month aus. Excel fügt automatisch Month in den Bereich Zeilen der PivotTable ein und zeigt die Monatsnamen in chronologischer Reihenfolge an.

  4. Wählen Sie im Bereich PivotTable-Felder die Option Sales aus. Excel fügt automatisch Summe von „Sales“ in den Wertebereich der PivotTable ein und zeigt die Gesamtzahl (Summe) der Limonadenverkäufe für jeden Monat an, etwa so:

    Screenshot of a Pivot Table showing sales summed by month.

    Sie können nun die Verkäufe nach Monat aggregiert anzeigen – so gab es zum Beispiel 1.056 Verkäufe im Juni.

Hinzufügen einer zweiten Dimension

  1. Wählen Sie im Bereich mit den PivotTable-Feldern die Option Day aus. Excel fügt automatisch Day in den Zeilenbereich der PivotTable ein und zeigt die Gesamtzahl (Summe) der Limonadenverkäufe für jeden Wochentag innerhalb jedes Monats an, etwa so:

    Screenshot of a Pivot Table showing sales grouped by month and day.

    Jetzt können Sie die monatlichen Verkäufe nach Wochentagen aggregiert anzeigen. Zum Beispiel wurden 57 der Verkäufe im Januar an einem Samstag getätigt. Sie können die Monate auch aufklappen/zuklappen, um einen Drillup/Drilldown in den Hierarchieebenen durchzuführen.

  2. Ziehen Sie im Bereich PivotTable-Felder den Eintrag Day aus dem Zeilenbereich in den Spaltenbereich. Excel zeigt nun die Gesamtverkäufe für jeden Monat in Zeilen an, aufgeschlüsselt nach Wochentagen in Spalten, etwa so:

    Screenshot of a Pivot Table showing sales grouped by month on rows and day on columns.

    Die monatlichen Verkäufe sind nach wie vor nach Wochentagen aufgeschlüsselt, aber Sie können auch (in der unteren Zeile) die Gesamtsummen für jeden Wochentag über das gesamte Jahr hinweg sehen. Beispielsweise wurden insgesamt 1.324 Verkäufe an einem Montag getätigt.

Ändern der Aggregation

  1. Klicken Sie in der Leiste PivotTable-Felder im Wertebereich auf den Dropdownpfeil neben Summe von „Sales“ und dann auf Wertefeldeinstellungen.

  2. Wählen Sie im Dialogfeld Wertfeldeinstellungen die Option Durchschnitt aus, wie hier gezeigt:

    Screenshot of setting field value settings to summarize value by average.

    Die Datentabelle zeigt nun die durchschnittliche Anzahl von Verkäufen für jeden Monat und jeden Wochentag, wie hier gezeigt:

    Screenshot of a Pivot Table showing average sales grouped by month on rows and day on columns.

    Sie können jetzt die durchschnittliche Anzahl von Verkäufen für jeden Wochentag nach Monat anzeigen. Zum Beispiel liegt die durchschnittliche Anzahl von Verkäufen an einem Mittwoch im Februar bei 19,75.

Herausforderung: PivotTable-Analyse

  1. Ändern Sie die Felder in der PivotTable, um die folgenden Informationen zu erhalten:
    • Die Gesamtsumme der Einnahmen für August.
    • Die Temperatur am heißesten Samstag im Juli.
    • Die niedrigste Anzahl von Flyern, die an einem Tag im November verteilt wurden.

Übung 2: Visualisieren von Daten mit Diagrammen

Trends und Beziehungen in Daten lassen sich oft leichter erkennen, wenn Sie Datenvisualisierungen wie beispielsweise Diagramme erstellen.

Anzeigen der Verkaufstrends für das Jahr

  1. Ändern Sie die in der vorherigen Übung erstellte PivotTable so ab, dass Date im Zeilenbereich und die Summe von Sales sowie die Summe von Temperature (in dieser Reihenfolge) im Wertebereich angezeigt werden:

    Screenshot of a Pivot Table showing sales and temperature totals by date.

    Stellen Sie sicher, dass Ihre Tabelle wie die abgebildete aussieht, bevor Sie fortfahren (beachten Sie, dass das Datum für Ihren Standort möglicherweise anders formatiert ist).

  2. Wählen Sie anhand der folgenden Anweisungen nur die Zellen aus, die die Werte für Datum, Tagesverkäufe und Temperatur enthalten, aber nicht die Überschriftenzellen Date, Summe von „Sales“ und Summe von „Temperature“ oder die Fußzeilenzellen Gesamtsumme:

    • Klicken Sie auf Zelle A4, die den Datumswert für den 1. Januar 2017 enthalten sollte.
    • Drücken Sie dann UMSCHALT + STRG + (UMSCHALT + + unter Mac OS X), um die Auswahl um die Verkaufs- und Temperaturwerte zu erweitern.
    • Drücken Sie dann UMSCHALT + STRG + (UMSCHALT + + unter Mac OS X), um die Zeilen unterhalb der aktuellen Auswahl auszuwählen.
    • Drücken Sie schließlich UMSCHALT+ , um die Auswahl der Gesamtsummen aufzuheben.
  3. Klicken Sie auf der Registerkarte Start des Menübands auf die Schaltfläche Kopieren (🗐), um die ausgewählten Zellen in die Zwischenablage zu kopieren.

  4. Klicken Sie unter dem Arbeitsblatt auf die Schaltfläche Neues Blatt (+), um der Arbeitsmappe ein neues Arbeitsblatt hinzuzufügen.

  5. Wählen Sie im neuen Blatt die Zelle A2 aus, und klicken Sie dann auf der Registerkarte Start auf die Schaltfläche Einfügen (📋), um die kopierten Zellen in das neue Arbeitsblatt einzufügen. Möglicherweise müssen Sie die Spalte A erweitern, um die Datumswerte zu sehen.

  6. Fügen Sie in den Zellen A1 bis C1 die Spaltenüberschriften Date, Sales und Temperature hinzu. Ihr neues Arbeitsblatt sollte wie folgt aussehen:

    Screenshot of a new worksheet showing sales and temperature totals by date.

  7. Wählen Sie die Daten Date und Sales aus, einschließlich der Überschriften (aber ohne die Temperaturdaten). Klicken Sie dann auf der Registerkarte Einfügen des Menübands in der Dropdownliste „Linie“ auf das erste Liniendiagrammformat. Excel fügt ein Liniendiagramm wie dieses ein:

    Screenshot of a line chart showing sales by date.

    Beachten Sie, dass das Liniendiagramm tägliche Schwankungen der Verkäufe zeigt, aber der allgemeine Trend scheint darauf hinzuweisen, dass die Verkäufe in den Sommermonaten höher und zu Beginn und Ende des Jahres niedriger sind.

  8. Löschen Sie das Diagramm, wählen Sie dann alle Daten und Überschriften aus (einschließlich Temperature), und fügen Sie ein neues Liniendiagramm ein. Auf diese Weise wird ein Diagramm wie dieses eingefügt:

    Screenshot of a line chart showing sales and temperature by date.

    Dieses Mal enthält das Diagramm separate Reihen für Sales und Temperature. Beide Datenreihen zeigen ein ähnliches Muster. Offenbar steigen sowohl die Verkäufe als auch die Temperatur in den Sommermonaten an.

  9. Wählen Sie das Diagramm aus, und doppelklicken Sie auf den Titel des Diagramms. Erweitern Sie dann auf der Registerkarte Format im Bereich Diagramm die Option Diagrammtitel, und ändern Sie den Diagrammtitel in Verkäufe und Temperatur:

    Screenshot of editing the chart title in Excel Online.

  10. Schließen Sie den Bereich Diagramm.

Anzeigen der Einnahmen nach Wochentag

  1. Kehren Sie zu dem Arbeitsblatt zurück, das die PivotTable enthält, und ändern Sie diese so, dass Day in Zeilen mit dem Durchschnitt von Revenue angezeigt wird. Ihr Ergebnis sollte wie folgt aussehen, auch wenn Ihre Wochentage möglicherweise nicht geordnet sind:

    Screenshot of a Pivot Table showing average revenue by day.

  2. Kopieren Sie die Werte für den Tag und die durchschnittlichen Einnahmen (aber nicht die Überschriften oder die Gesamtsumme) in die Zwischenablage, und fügen Sie dann ein neues Arbeitsblatt hinzu. Fügen Sie die kopierten Daten in die Zelle A2 ein, und fügen Sie die Überschriften Day und Mittelwert von „Revenue“ wie folgt hinzu:

    Screenshot of a new worksheet showing average revenue by day.

  3. Wählen Sie die Spaltenüberschrift B aus, und verwenden Sie auf der Registerkarte Start des Menübands das Menü $, um die Daten zu den Einnahmen im Format $ Englisch (Vereinigte Staaten) zu formatieren, etwa so:

    Screenshot of a worksheet showing average revenue by day formatted as U S currency.

  4. Wählen Sie alle Daten aus, einschließlich der Überschriften Day und Mittelwert von „Revenue“, und wählen Sie auf der Registerkarte Einfügen des Menübands in der Dropdownliste Säule das erste Säulendiagrammformat. Es wird ein Diagramm wie dieses erstellt:

    Screenshot of a column chart showing average revenue by day.

    Auf den ersten Blick scheint dieses Diagramm erhebliche Unterschiede zwischen den durchschnittlichen Einnahmen an verschiedenen Wochentagen zu zeigen, wobei die Einnahmen an Donnerstagen viel höher sind als an Sonntagen. Schauen Sie sich jedoch die Skala auf der vertikalen (Y) Achse genauer an – der Unterschied beträgt weniger als 30 Cent.

  5. Markieren Sie das Säulendiagramm, und wählen Sie auf der Registerkarte Diagramm des Menübands in der Dropdownliste Kreis das Format 2D-Kreisdiagramm aus. Das Diagramm wird in ein Kreisdiagramm wie dieses umgewandelt:

    Screenshot of a pie chart showing average revenue by day.

    Beachten Sie, dass die Kreissegmente für jeden Tag mehr oder weniger gleich groß sind.

  6. Markieren Sie das Kreisdiagramm, und wählen Sie auf der Registerkarte Diagramm in der Dropdownliste Datenbeschriftungen die Option Am Ende innerhalb aus. Dadurch werden die tatsächlichen Datenmengen im Diagramm angezeigt:

    Screenshot of a pie chart showing average revenue by day with data labels.

    Jetzt wird deutlicher, dass es bei den durchschnittlichen Einnahmen an den verschiedenen Wochentagen kaum Unterschiede gibt.

Anzeigen von Verkäufen nach Flyern

  1. Kehren Sie zu dem Arbeitsblatt zurück, das die PivotTable enthält, und ändern Sie diese so, dass Date in Zeilen mit der Summe von Flyers und der Summe von Sales angezeigt wird:

    Screenshot of a Pivot Table showing flyers and sales totals by date.

  2. Kopieren Sie die Werte für Datum, Flyer und Verkäufe (aber nicht die Überschriften oder Gesamtsummen) in ein neues Arbeitsblatt, und fügen Sie die Überschriften Date, Flyers und Sales wie folgt hinzu:

    Screenshot of a new worksheet showing total flyers and sales by date.

  3. Wählen Sie die Daten und Überschriften von Flyers und Sales (aber nicht die Datumsangaben) aus. Wählen Sie dann auf der Registerkarte Einfügen in der Dropdownliste Punkt das erste Punktdiagrammformat aus. Dadurch wird ein Punktdiagramm wie dieses erstellt:

    Screenshot of a scatter plot showing total flyers by sales.

    Hinweis

    Das Diagramm zeigt die Anzahl der täglich verteilten Flyer auf der horizontalen (X) Achse und die Anzahl von Verkäufen pro Tag auf der vertikalen (Y) Achse aus. Das Diagramm bildet eine annähernd diagonale Linie (mit einer gewissen Abweichung), die auf einen allgemeinen Trend hindeutet, bei dem die Anzahl von Verkäufen tendenziell mit der Anzahl der verteilten Flugblätter ansteigt.

Verkäufe nach Niederschlag

  1. Kehren Sie zu dem Arbeitsblatt zurück, das die PivotTable enthält, und ändern Sie diese so, dass Date in Zeilen mit der Summe von Rainfall und der Summe von Sales angezeigt wird:

    Screenshot of a Pivot Table showing rainfall and sales totals by date.

  2. Kopieren Sie die Werte für Datum, Niederschlag und Umsatz (aber nicht die Überschriften oder Gesamtsummen) in ein neues Arbeitsblatt, und fügen Sie die Überschriften Date, Rainfall und Sales wie folgt hinzu:

    Screenshot of a new worksheet showing total rainfall and sales by date.

  3. Wählen Sie die Daten und Überschriften von Rainfall und Sales (aber nicht die Datumsangaben) aus. Wählen Sie dann auf der Registerkarte Einfügen in der Dropdownliste Punkt das erste Punktdiagrammformat aus. Dadurch wird ein Punktdiagramm wie dieses erstellt:

    Screenshot of a scatter plot showing total rainfall by sales.

    Dieses Diagramm scheint auf eine Art Beziehung zwischen Niederschlag und Verkäufen hinzuweisen, wobei die Verkäufe mit zunehmendem Niederschlag abnehmen. Allerdings ist die Linie, die durch die Punkte gebildet wird, gekrümmt. Das lässt oft auf eine nicht lineare, möglicherweise logarithmische Beziehung schließen.

  4. Löschen Sie das Diagramm, damit Sie die leeren Spalten D und E nach den täglichen Niederschlagsmengen und Verkaufsdaten anzeigen können.

  5. Fügen Sie in D1 die Spaltenüberschrift LogRainfall ein. Wählen Sie dann die Zelle D2 aus, und geben Sie die folgende Formel in das Feld fx oberhalb des Arbeitsblatts ein, um den Logarithmus zur Basis 10 des Niederschlagswerts zu berechnen:

    =log(B2)
    
  6. Kopieren Sie die Formel in die übrigen Zellen in der Spalte LogRainfall. Dies geht am einfachsten, indem Sie die Zelle mit der Formel auswählen und auf den kleinen quadratischen Ziehpunkt () unten rechts in der ausgewählten Zelle doppelklicken.

  7. Fügen Sie in E1 die Spaltenüberschrift LogSales ein. Wählen Sie dann die Zelle E2 aus, und geben Sie die folgende Formel in das Feld fx oberhalb des Arbeitsblatts ein, um den Logarithmus zur Basis 10 des Verkaufswerts zu berechnen:

    =log(C2)
    
  8. Kopieren Sie die Formel in die übrigen Zellen in der Spalte LogSales.

  9. Wählen Sie die Daten und Überschriften von LogRainfall und LogSales aus. Wählen Sie dann auf der Registerkarte Einfügen in der Dropdownliste Punkt das erste Punktdiagrammformat aus. Dadurch wird ein Punktdiagramm wie dieses erstellt:

    Screenshot of a scatter plot showing log rainfall by log sales.

    Beachten Sie, dass dieses Diagramm eine lineare Beziehung zwischen dem Logarithmus des Niederschlags und dem Logarithmus der Verkäufe zeigt. Dies kann nützlich sein, wenn Sie die Beziehungen in den Daten untersuchen, da es einfacher ist, eine lineare Gleichung zu berechnen, die den Niederschlag mit den Verkäufen in Beziehung setzt, anstatt für die gleiche Aufgabe eine logarithmische Gleichung zu definieren.

Herausforderung: Visualisieren von Daten

  1. Erstellen Sie ein Säulendiagramm mit der Summe der an jedem Wochentag verteilten Flugblätter, und ermitteln Sie die Tage, an denen die höchste und die niedrigste Anzahl von Flugblättern verteilt wurde.
  2. Erstellen Sie ein Punktdiagramm mit der Tagestemperatur und der Niederschlagsmenge, und untersuchen Sie die offensichtliche Beziehung zwischen diesen Feldern.