Analysieren eines Szenarios und Zuordnen dieses Szenarios zu einer HDInsight-Konfigurationsoption

Abgeschlossen

Lesen Sie die folgende Fallstudie, und beantworten Sie die Fragen zum Zuordnen eines Szenarios zu einer HDInsight-Clusterkonfiguration.

Fallstudie – AdventureWorks-Zyklen

AdventureWorks verkauft Fahrräder und Fahrradteile direkt an Kunden und Händler. Das Unternehmen verfügt zurzeit über einen einzelnen Standort in den Niederlanden. Es hat in den USA, in Deutschland und in Spanien über eine Handelskette und durch Onlineverkäufe auf seiner Website Fahrräder verkauft. Die Lieferungen werden von lokalen Versandzentren abgewickelt.

Das Unternehmen möchte expandieren und plant hierfür, neue Standorte einzurichten, weil die Verkaufszahlen in diesen Ländern/Regionen in den letzten drei Jahren gestiegen sind. Die Speicherorte lauten:

  • Tokio, Japan
  • Seattle, USA
  • Chicago, USA
  • Berlin, Deutschland
  • Barcelona, Spanien
  • Paris, Frankreich

Auf dem Markt von AdventureWorks herrschte in den letzten 15 Jahren starker Wettbewerb. Das Unternehmen möchte das innovativste Fahrradunternehmen werden und Fahrradbesitzern heute und in Zukunft erstklassige Technologien und Dienste bieten. Die Forschungs- und Entwicklungsabteilung von AdventureWorks hat erfolgreich die nächste Generation innovativer Produkte entwickelt. Das Unternehmen verlässt sich beim Design und der Implementierung der Lösung auf Data Engineers, AI Engineers und Data Scientists.

Weil die Verkaufszahlen gestiegen sind und das Unternehmen global expandieren möchte, erfüllt die bereits vorhandene Dateninfrastruktur nicht die Unternehmensanforderungen oder wird dem angestrebten zukünftigen Wachstum von AdventureWorks nicht gerecht. Die Chief Information und Technologie Officers haben den Wunsch geäußert, vorhandene lokale Systeme einzustellen und in die Cloud zu wechseln, um dem erwarteten Wachstum gerecht zu werden. Dieser Plan wird vom CFO unterstützt, da der Lebenszyklus der vorhandenen Infrastruktur bald endet und bereits Ersatzhardware beantragt wurde. Der CFO weiß, dass die Cloud kostengünstigere Alternativen bieten könnte.

Sie sind Senior Data Engineer und unterstützen AdventureWorks beim Entwerfen und Implementieren von Lösungen. Damit unterstützen Sie das Unternehmen dabei, unternehmensinterne, funktionale und technische Anforderungen zu erfüllen, die für die Wachstums-, Expansions- und Innovationsstrategien festgelegt wurden. Sie achten bei der Ausführung dieses Plans auf die Minimierung der Betriebskosten und Funktionen zur Überwachung der Effektivität.

In einem Discovery Workshop werden die folgenden Themen behandelt:

Datenanalyse

Die Geschäftsberichte werden zurzeit von einer einzelnen lokalen Datenbank bereitgestellt, die als Data Warehouse konfiguriert ist. Sie enthält eine Datenbank mit dem Namen AdventureWorksDW, die verwendet wird, um Verlaufsberichte und beschreibende Analysen bereitzustellen. In letzter Zeit hatte der Server Schwierigkeiten, die Berichtsdaten schnell zu verarbeiten, und Ihr Team sollte sicherstellen, dass der Zugriff auf die Daten eingeschränkt ist.

AdventureWorks möchte auch die Datenanalyse weiter nutzen und erstmals Predictive Analytics-Funktionen einsetzen. Hierfür wurden noch keine Maßnahmen ergriffen. Das Unternehmen weiß, dass es eine Empfehlungs- oder Textanalyse-Engine erstellen könnte. Sie sollen eine Empfehlung zur besten Technologie und zum besten Ansatz für eine solche Lösung aussprechen, die ebenfalls resilient und leistungsfähig sein soll.

Analyse sozialer Medien

In den letzten Jahren hat die Marketingabteilung des Unternehmens zu verschiedenen Jahreszeiten eine Vielzahl von Twitter-Kampagnen geschaltet. Es möchte die Wirkung seiner Arbeit messen, indem es während dieser Kampagnen Social-Media-Ressourcen wie Hashtags nachverfolgt. Es möchte die Möglichkeit haben, jedes Hashtag mit jedem beliebigen Namen nachzuverfolgen.

Vernetztes Fahrrad

AdventureWorks-Fahrräder können mit einem innovativen integrierten Fahrradcomputer ausgestattet werden. Dieser Computer umfasst automatische Abschließfeatures für das Fahrrad sowie Informationen zum Betriebsstatus. Von diesem Fahrradcomputer werden u. a. die folgenden Informationen erfasst:

  • Fahrradmodell, Seriennummer und registrierter Besitzer
  • Standort des Fahrrads (Breiten- und Längengrad)
  • Aktueller Status (abgestellt, in Bewegung)
  • Aktuelle Geschwindigkeit in Kilometern pro Stunde
  • Fahrrad abgeschlossen/nicht abgeschlossen
  • Informationen zu Fahrradteilen und -komponenten (bei E-Bikes)

Die Anwendungen von Microsoft und externen Anbietern können auf die Informationen des Fahrradcomputers zugreifen, der abgesichert sein muss. Diese Informationen können für die Integration in mobile Anwendungen, das Anzeigen von Echtzeitinformationen zum Standort und Bike Sharing-Informationen verwendet werden. Darüber hinaus können tägliche Zusammenfassungsdaten in Flatfiles gespeichert werden. Zu diesen Daten gehören das Fahrradmodell, die Seriennummer, der registrierte Besitzer, eine Zusammenfassung der pro Tag gefahrenen Kilometer und die durchschnittliche Geschwindigkeit.

Fahrradwartungsdienste

Fahrradbesitzer können Benachrichtigungen zum Reparaturbedarf des Fahrrads aktivieren. Diese Informationen basieren auf:

  • Telemetriedaten von einem E-Bike, die auf Sensordaten basieren
  • Informationen zur Fahrradnutzung, die vom integrierten Fahrradcomputer stammen und auf den durchschnittlichen gefahrenen Kilometern und der Abnutzung basieren
  • Dieses Predictive Maintenance-Szenario ist ein kostenpflichtiger Service, den Fahrradbesitzer abonnieren können.

Fragen

Beantworten Sie die folgenden Fragen auf der Grundlage der Fallstudie:


Wissensbeurteilung

1.

Welche HDInsight-Clusterkonfiguration würde sich dafür eignen, die Streaminganforderungen zu erfüllen, die für das Szenario mit dem vernetzten Fahrrad benötigt werden?

2.

Welche HDInsight-Clusterkonfiguration würde sich für die Datenanalyse eignen, die vom Data Warehouse auf der lokalen SQL Server-Instanz durchgeführt wird?

3.

Welche HDInsight-Clusterkonfiguration würde sich dafür eignen, Predictive Maintenance-Tasks in Bicycle Maintenance Service durchzuführen?

4.

Welchen Datenspeicher sollten Sie verwenden, um allen diesen Workloads und den in den vorherigen Fragen beschriebenen Szenarios gerecht zu werden?