Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Ziel der meisten Big Data-Lösungen ist es, über Analysen und Berichte Einblicke in die Daten zu bieten. Analysen und Berichte können vorkonfigurierte Berichte und Visualisierungen oder interaktive Datensuche umfassen.
Optionen für Datenanalysetechnologien
Je nach Ihren Anforderungen haben Sie für die Analyse, Visualisierung und Berichterstellung in Azure mehrere Optionen:
Power BI
Power BI ist eine Suite von Business Analytics-Tools. Sie kann eine Verbindung mit Hunderten von Datenquellen herstellen und sie für ungeplante Analysen verwenden. Verwenden Sie Power BI Embedded , um Power BI in Ihre eigenen Anwendungen zu integrieren, ohne dass eine zusätzliche Lizenzierung erforderlich ist.
Organisationen können Power BI verwenden, um Berichte zu erstellen und für die gesamte Organisation zu veröffentlichen. Jeder kann personalisierte Dashboards mit integrierter Governance und Sicherheit erstellen. Power BI verwendet Microsoft Entra-ID , um Benutzer zu authentifizieren, die sich beim Power BI-Dienst anmelden. Es verwendet die Power BI-Anmeldeinformationen, wenn ein Benutzer versucht, auf Ressourcen zuzugreifen, die eine Authentifizierung erfordern.
Jupyter Notebooks
Jupyter-Notizbücher bieten eine browserbasierte Shell, mit der Datenwissenschaftler Notizbuchdateien erstellen können, die Python-, Scala- oder R-Code und Markdown-Text enthalten. Notizbücher ermöglichen eine effektive Zusammenarbeit, indem sie Code und Ergebnisse in einem einzigen Dokument teilen und dokumentieren.
Die meisten Varianten von HDInsight-Clustern wie Spark oder Hadoop sind vorkonfiguriert mit Jupyter-Notizbüchern für die Interaktion mit Daten und übermitteln Aufträge für die Verarbeitung. Abhängig vom Typ des verwendeten HDInsight-Clusters werden mindestens ein Kernel bereitgestellt, um den Code zu interpretieren und auszuführen. Spark-Cluster auf HDInsight stellen beispielsweise Spark-bezogene Kernel bereit, die Sie auswählen können, um Python- oder Scala-Code mithilfe des Spark-Moduls auszuführen.
Jupyter-Notizbücher bieten eine effektive Umgebung zum Analysieren, Visualisieren und Verarbeiten Ihrer Daten, bevor Sie erweiterte Visualisierungen mithilfe eines BI-Berichterstellungstools wie Power BI erstellen.
Zeppelin-Notebooks
Zeppelin-Notizbücher bieten auch eine browserbasierte Shell mit ähnlichen Funktionen wie Jupyter-Notizbücher. Einige HDInsight-Cluster sind vorkonfiguriert mit Zeppelin-Notizbüchern. Wenn Sie jedoch einen HDInsight Interactive Query -Cluster (auch als Apache Hive LLAP bezeichnet) verwenden, ist Zeppelin das einzige Notizbuch, mit dem Sie interaktive Hive-Abfragen ausführen können. Wenn Sie auch einen in eine Domäne eingebundenen HDInsight-Cluster verwenden, sind Zeppelin-Notizbücher der einzige Typ von Notizbüchern, mit denen Sie unterschiedliche Benutzeranmeldungen zuweisen können, um den Zugriff auf Notizbücher und die zugrunde liegenden Hive-Tabellen zu steuern.
Jupyter-Notizbücher in VS Code
VS Code ist ein kostenloser Code-Editor und eine Entwicklungsplattform, die Sie lokal oder remote verwenden können. Wenn Sie VS Code mit der Jupyter-Erweiterung verwenden, bietet sie eine vollständig integrierte Umgebung für die Jupyter-Entwicklung, die mit weiteren Spracherweiterungen verbessert werden kann. Wählen Sie diese Option aus, wenn Sie eine erstklassige, kostenlose Jupyter-Erfahrung wünschen und Ihre Berechnung ihrer Wahl verwenden können.
Mithilfe von VS Code können Sie Notizbücher für Remotes und Container entwickeln und ausführen. Um den Übergang von Azure-Notizbüchern zu vereinfachen, ist das Containerimage auch für Die Verwendung mit VS Code verfügbar.
Jupyter (ehemals IPython Notebook) ist ein Open-Source-Projekt, mit dem Sie problemlos Markdowntext und ausführbaren Python-Quellcode auf einem Zeichenbereich kombinieren können, der als Notebook bezeichnet wird. VS Code unterstützt das systemeigene Arbeiten mit Jupyter-Notizbüchern und über Python-Codedateien.
Wichtige Auswahlkriterien
Beginnen Sie mit der Eingrenzung Ihrer Auswahl, indem Sie die folgenden Fragen beantworten:
Müssen Sie eine Verbindung mit zahlreichen Datenquellen herstellen und einen zentralen Ort zum Erstellen von Berichten für Daten bereitstellen, die in Ihrer gesamten Domäne verteilt sind? Wenn Sie dies tun, wählen Sie eine Option aus, mit der Sie eine Verbindung mit Hunderten von Datenquellen herstellen können.
Möchten Sie dynamische Visualisierungen in eine externe Website oder Anwendung einbetten? Wenn Sie dies tun, wählen Sie eine Option aus, die Einbettungsfunktionen bereitstellt.
Möchten Sie Ihre Visualisierungen und Berichte im Offlinezustand entwerfen? Wenn Sie dies tun, wählen Sie eine Option mit Offlinefunktionen aus.
Benötigen Sie eine hohe Verarbeitungsleistung, um große oder komplexe KI-Modelle zu trainieren oder mit großen Datasets zu arbeiten? Wenn Sie dies tun, wählen Sie eine Option aus, die eine Verbindung mit einem Big Data-Cluster herstellen kann.
Funktionsmatrix
In der folgenden Tabelle sind die wichtigsten Unterschiede in den Funktionen zusammengefasst.
Allgemeine Funktionen
Funktion | Power BI | Jupyter Notebooks | Zeppelin-Notebooks | Jupyter-Notizbücher in VS Code |
---|---|---|---|---|
Herstellen einer Verbindung mit Big Data-Clustern zur erweiterten Verarbeitung | Ja | Ja | Ja | Nein |
Verwalteter Dienst | Ja | Ja 1 | Ja 1 | Ja |
Herstellen einer Verbindung mit Hunderten von Datenquellen | Ja | Nein | Nein | Nein |
Offlinefunktionen | Ja 2 | Nein | Nein | Nein |
Einbettung von Funktionen | Ja | Nein | Nein | Nein |
Automatische Datenaktualisierung | Ja | Nein | Nein | Nein |
Zugriff auf zahlreiche Open-Source-Pakete | Nein | Ja 3 | Ja 3 | Ja 4 |
Datentransformation oder Bereinigungsoptionen | Power Query, R | 40 Sprachen, z.B. Python, R, Julia und Scala | Mehr als 20 Interpreter, darunter Python, JDBC und R | Python, F#, R |
Preise | Kostenlos für Power BI Desktop (Dokumenterstellung). Siehe Power BI-Preise für Hostingoptionen. | Kostenlos | Kostenlos | Kostenlos |
Kollaboration mehrerer Benutzer | Ja | Ja (per Freigabe oder über einen Mehrbenutzendenserver wie JupyterHub) | Ja | Ja (per Freigabe) |
[1] Bei Verwendung als Teil eines verwalteten HDInsight-Clusters.
[2] Bei Verwendung von Power BI Desktop.
[3] Sie können das Maven-Repository nach Von der Community beigetragenen Paketen durchsuchen.
[4] Sie können Python-Pakete entweder mit Pip oder Conda installieren. Sie können R-Pakete von CRAN oder GitHub installieren. Sie können Pakete in F# über nuget.org mithilfe des Paketabhängigkeits-Managers installieren.
Beitragende
Microsoft verwaltet diesen Artikel. Die folgenden Mitwirkenden haben diesen Artikel geschrieben.
Hauptautor:
- Zoiner Tejada | CEO und Architekt
Um nicht-öffentliche LinkedIn-Profile anzuzeigen, melden Sie sich bei LinkedIn an.
Nächste Schritte
- Einführung in Databricks-Notizbücher
- Ausführen von Azure Databricks-Notizbüchern mit Azure Data Factory
- Führen Sie Jupyter-Notizbücher in Ihrem Arbeitsbereich aus
- Was ist Power BI?