Apache-Open-Source-Szenarien in Azure

Artikel
07/19/2024

Microsoft ist stolz darauf, Open-Source-Projekte, -Initiativen und -Stiftungen zu unterstützen und zu Tausenden von Open-Source-Communitys beizutragen. Mithilfe von Open-Source-Technologien in Azure können Sie Anwendungen auf Ihre Weise ausführen und gleichzeitig Ihre Investitionen optimieren.

Dieser Artikel enthält eine Zusammenfassung von Architekturen und Lösungen, bei denen Azure zusammen mit Apache-Open-Source-Lösungen verwendet wird.

Apache®, Apache Ignite, Ignite und das Flammenlogo sind entweder eingetragene Marken oder Marken der Apache Software Foundation in den USA und/oder anderen Ländern. Die Verwendung dieser Markierungen impliziert kein Endorsement durch die Apache Software Foundation.

Apache Cassandra

Aufbau	Zusammenfassung	Technologieschwerpunkt
Leitfaden zur Datenpartitionierung	Hier finden Sie einen Leitfaden zur Trennung von Datenpartitionen für separate Verwaltung und separaten Zugriff. Des Weiteren finden Sie hier grundlegende Informationen zu horizontalen, vertikalen und funktionalen Partitionierungsstrategien. Cassandra eignet sich ideal für vertikale Partitionierung.	Datenbanken
Hochverfügbarkeit im öffentlichen Azure MEC	Erfahren Sie, wie Sie Workloads im Aktiv/Standby-Modus bereitstellen, um Hochverfügbarkeit und Notfallwiederherstellung im öffentlichen Azure-Multi-Access-Edgecompute zu erreichen. Cassandra kann zur Unterstützung von Georeplikation verwendet werden.	Hybrid
N-schichtige Anwendung mit Apache Cassandra	Hier erfahren Sie, wie Sie Linux-VMs und ein virtuelles Netzwerk bereitstellen, das für eine n-schichtige Architektur mit Apache Cassandra konfiguriert ist.	Datenbanken
Nicht relationale Daten und NoSQL	Enthält eine Beschreibung von nicht relationalen Datenbanken, in denen Daten je nach den Anforderungen als Schlüssel-Wert-Paare, Graphen, Zeitreihen, Objekte oder mit anderen Speichermodellen gespeichert werden. Azure Cosmos DB for Apache Cassandra ist ein empfohlener Azure-Dienst.	Datenbanken
Ausführen von Apache Cassandra auf Azure-VMs	Untersuchen von Überlegungen zur Leistung beim Ausführen von Apache Cassandra auf virtuellen Azure-Computern. Verwenden Sie diese Empfehlungen als Baseline für Tests Ihrer Workload.	Datenbanken
Streamverarbeitung mit vollständig verwalteten Open-Source-Daten-Engines	Streamen von Ereignissen mithilfe vollständig verwalteter Azure-Datendienste. Verwenden Sie Open-Source-Technologien wie Kafka, Kubernetes, Cassandra, PostgreSQL und Redis-Komponenten.	Analytics

Apache CouchDB

Aufbau	Zusammenfassung	Technologieschwerpunkt
Baselinewebanwendung mit Zonenredundanz	Nutzen Sie die bewährten Praktiken in dieser Referenzarchitektur, um Redundanz, Skalierbarkeit und Leistung in einer Azure App Service-Webanwendung zu verbessern. CouchDB ist eine empfohlene Dokumentdatenbank.	Web

Apache Hadoop

Aufbau	Zusammenfassung	Technologieschwerpunkt
KI am Edge mit Azure Stack Hub	Bringen Sie Ihr trainiertes KI-Modell mit Azure Stack Hub zum Edge. Integrieren Sie es in Ihre Anwendungen, um Intelligence mit geringer Latenz zu ermöglichen. Verwenden Sie Hadoop zum Speichern von Daten.	KI
KI am Edge mit Azure Stack Hub: getrennt	Nutzen Sie die Leistung von Edge-KI, wenn Sie nicht mit dem Internet verbunden sind, und verlagern Sie Ihre KI-Modelle an den Edge – mit einer Lösung, die Azure Stack Hub umfasst. Verwenden Sie Hadoop zum Speichern von Daten.	KI
Big Data-Architekturen	Enthält eine Beschreibung der Big Data-Architekturen, mit denen die Erfassung, Verarbeitung und Analyse von Daten durchgeführt wird, die für herkömmliche Datenbanksysteme zu groß oder zu komplex sind. Azure HDInsight Hadoop-Cluster können für Batchverarbeitung verwendet werden.	Datenbanken
Auswählen einer Datenübertragungstechnologie	Enthält eine Beschreibung der Optionen für die Datenübertragung in Azure, z. B. Import/Export-Dienst, Azure Data Box, Azure Data Factory und Befehlszeilentools sowie Tools mit grafischer Benutzeroberfläche. Das Hadoop-Ökosystem stellt Tools für die Datenübertragung zur Verfügung.	Datenbanken
Bürger-KI mit Power Platform	Erfahren Sie, wie Sie mit Azure Machine Learning und Power Platform schnell einen Proof of Concept für maschinelles Lernen sowie eine Produktionsversion erstellen können. Azure Data Lake (ein Hadoop-kompatibles Dateisystem) speichert Daten.	KI
Data considerations for microservices (Überlegungen zu Daten für Microservices)	Erfahren Sie mehr über das Verwalten von Daten in einer Microservicearchitektur. Sehen Sie sich ein Beispiel an, in dem Azure Data Lake Store, ein Hadoop-Dateisystem, verwendet wird.	Microservices
Extrahieren, Transformieren und Laden	Enthält eine Beschreibung der Datentransformationspipelines vom Typ ETL (Extrahieren/Transformieren/Laden) und ELT (Extrahieren/Laden/Transformieren) und der Nutzung von Ablaufsteuerungen und Datenflüssen. Hadoop kann als Zieldatenspeicher in ELT-Prozessen verwendet werden.	Analyse
IoT-Analyse- und Optimierungsschleifen	In diesem Artikel erhalten Sie Informationen zu Analyse- und Optimierungsschleifen, ein IoT-Muster für das Generieren und Anwenden von Optimierungserkenntnissen, die auf einem gesamten Geschäftskontext basieren. Die Hadoop-Map-Reduce-Verarbeitung kann zum Verarbeiten von Big Data verwendet werden.	IoT
Muster für materialisierte Sichten	Generieren Sie vorab aufgefüllte Sichten für die Daten in mindestens einem Datenspeicher, wenn die Daten für Ihre erforderlichen Abfragevorgänge nicht ideal formatiert sind. Verwenden Sie Hadoop für einen Big Data-Speichermechanismus, der Indizierung unterstützt.	Datenbanken
Vorhersagen von Kreditausbuchungen mit HDInsight Spark	Verwenden Sie HDInsight und maschinelles Lernen, um die Wahrscheinlichkeit von Kreditausbuchungen vorherzusagen. HDInsight unterstützt Hadoop.	Datenbanken

Apache HBase

Aufbau	Zusammenfassung	Technologieschwerpunkt
KI am Edge mit Azure Stack Hub	Bringen Sie Ihr trainiertes KI-Modell mit Azure Stack Hub zum Edge. Integrieren Sie es in Ihre Anwendungen, um Intelligence mit geringer Latenz zu ermöglichen. Verwenden Sie HBase zum Speichern von Daten.	KI
KI am Edge mit Azure Stack Hub: getrennt	Nutzen Sie die Leistung von Edge-KI, wenn Sie nicht mit dem Internet verbunden sind, und verlagern Sie Ihre KI-Modelle an den Edge – mit einer Lösung, die Azure Stack Hub umfasst. Verwenden Sie HBase zum Speichern von Daten.	KI
Big Data-Architekturen	Enthält eine Beschreibung der Big Data-Architekturen, mit denen die Erfassung, Verarbeitung und Analyse von Daten durchgeführt wird, die für herkömmliche Datenbanksysteme zu groß oder zu komplex sind. In diesen Szenarien können Sie HBase für die Datenpräsentation verwenden.	Datenbanken
Auswählen einer Big Data-Speichertechnologie	Vergleichen Sie Big Data-Speichertechnologieoptionen in Azure. Enthält eine Erläuterung von HBase in HDInsight.	Datenbanken
Auswählen eines Analysedatenspeichers	Erfahren Sie mehr über die Verwendung von HBase für leistungsfähigen, zufälligen Zugriff und ein hohes Maß an Konsistenz für große Mengen an unstrukturierten und teilweise strukturierten Daten.	Analytics
Anleitungen zur Datenpartitionierung	Sehen Sie sich die Anleitungen zum Trennen von Datenpartitionen an, damit sie separat verwaltet und aufgerufen werden können. Des Weiteren finden Sie hier grundlegende Informationen zu horizontalen, vertikalen und funktionalen Partitionierungsstrategien. HBase eignet sich ideal für vertikale Partitionierung.	Datenbanken
Nicht relationale Daten und NoSQL	Enthält eine Beschreibung von nicht relationalen Datenbanken, in denen Daten je nach den Anforderungen als Schlüssel-Wert-Paare, Graphen, Zeitreihen, Objekte oder mit anderen Speichermodellen gespeichert werden. HBase kann für Spalten- und Zeitreihendaten verwendet werden.	Datenbanken

Apache Hive

Aufbau	Zusammenfassung	Technologieschwerpunkt
Big Data-Architekturen	Enthält eine Beschreibung der Big Data-Architekturen, mit denen die Erfassung, Verarbeitung und Analyse von Daten durchgeführt wird, die für herkömmliche Datenbanksysteme zu groß oder zu komplex sind. In diesen Szenarien können Sie Hive für Batchverarbeitung und Datenpräsentation verwenden.	Datenbanken
Auswählen einer Batchverarbeitungstechnologie	Vergleichen Sie die verschiedenen Technologien für Big Data-Batchverarbeitung in Azure. Informieren Sie sich über die Funktionen von Hive.	Analytics
Auswählen eines Analysedatenspeichers	Bewerten Sie Optionen für analytische Datenspeicher für Big Data in Azure. Informieren Sie sich über die Funktionen von Hive.	Analyse
Extrahieren, Transformieren und Laden	Erfahren Sie mehr über ETL- und ELT-Datentransformationspipelines und über die Verwendung von Ablaufsteuerungs- und Datenflüssen. In ELT können Sie Hive verwenden, um Quelldaten abzufragen. Sie können Hive auch zusammen mit Hadoop als Datenspeicher verwenden.	Datenbanken
Kreditausbuchungsprognose mit HDInsight Spark-Clustern	Verwenden Sie HDInsight und maschinelles Lernen, um die Wahrscheinlichkeit von Kreditausbuchungen vorherzusagen. Analyseergebnisse werden in Hive-Tabellen gespeichert.	Analytics
Vorausschauende Flugzeugtriebwerksüberwachung	Erfahren Sie, wie Echtzeit-Flugzeugdaten mit Analysen kombiniert werden, um eine Lösung für die vorausschauende Überwachung und Integritätsanalyse von Flugzeugtriebwerken zu erstellen. Hive-Skripts stellen Aggregationen für die von Azure Stream Analytics archivierten Ereignisrohdaten bereit.	Analyse
Prognoseinformationen mit Verkehrstelematik	Erfahren Sie, wie Autohändler, Hersteller und Versicherungsunternehmen Azure nutzen können, um prädiktive Erkenntnisse über den Fahrzeugzustand und Fahrgewohnheiten zu gewinnen. In dieser Lösung verwendet Azure Data Factory HDInsight, um Hive-Abfragen zum Verarbeiten und Laden von Daten auszuführen.	Analyse
Skalierung von KI- und Machine-Learning-Initiativen in regulierten Branchen	Erfahren Sie mehr über die Skalierung von Azure KI- und Machine Learning-Umgebungen, die umfangreiche Sicherheitsrichtlinien erfüllen müssen. Hive wird zum Speichern von Metadaten verwendet.	KI

Apache JMeter

Aufbau	Zusammenfassung	Technologieschwerpunkt
Cloudtransformationslösung für ein Bankingsystem in Azure	Verwenden Sie simulierte und tatsächliche Anwendungen sowie vorhandene Workloads, um die Reaktion einer Lösungsinfrastruktur auf Skalierbarkeit und Leistung zu überwachen. Eine benutzerdefinierte JMeter-Lösung wird für Auslastungstests verwendet.	Migration
Muster und Implementierungen bei der Cloudtransformation für das Bankwesen	Erfahren Sie mehr über die Muster und Implementierungen, die zum Transformieren eines Banksystems für die Cloud verwendet werden. JMeter wird für Auslastungstests verwendet.	Migration
Skalierbare Cloudanwendungen und SRE	Erstellen Sie skalierbare Cloudanwendungen, indem Sie die Leistungsmodellierung und andere SRE-Prinzipien und -Methoden (Site Reliability Engineering) nutzen. JMeter wird für Auslastungstests verwendet.	Web

Apache Kafka

Aufbau	Zusammenfassung	Technologieschwerpunkt
Anwendungsdatensicherheit für AKS-Workloads in Azure NetApp Files	Bereitstellen von Astra Control Service mit Azure NetApp Files für Datenschutz, Notfallwiederherstellung und Mobilität für AKS-Anwendungen (Azure Kubernetes Service) einschließlich Kafka-Anwendungen bereit.	Container
Asynchrone Messagingoptionen	Erfahren Sie mehr über asynchrone Messagingoptionen in Azure, einschließlich Unterstützung für Kafka-Clients.	Integration
Steuerung einer Flotte von fahrerlosen Transportfahrzeugen	Erfahren Sie mehr über einen End-to-End-Ansatz für einen OEM (Original Equipment Manufacturer) in der Automobilindustrie. Enthält mehrere Open-Source-Bibliotheken, die Sie wiederverwenden können. Back-End-Dienste in dieser Architektur können eine Verbindung mit Kafka herstellen.	Web
Überwachung mit Azure Data Explorer	Verwenden Sie Azure Data Explorer in einer hybriden Überwachungslösung, die gestreamte und gebatchte Protokolle aus Kafka und anderen Quellen erfasst.	Analytics
Cloudtransformationslösung für ein Bankingsystem in Azure	Verwenden Sie simulierte und tatsächliche Anwendungen sowie vorhandene Workloads, um die Reaktion einer Lösungsinfrastruktur auf Skalierbarkeit und Leistung zu überwachen. Ereignisse aus Event Hubs für Kafka werden in das System eingespeist.	Container
Auswählen einer Technologie für die Datenstromverarbeitung	Vergleichen Sie Optionen für die Echtzeitverarbeitung von Nachrichtenstreams in Azure, einschließlich der Kafka-Streams-API.	Analytics
Muster für die Anspruchsprüfung	Untersuchen des Claim Check-Musters, das eine große Nachricht in Claim Check und Nutzdaten aufteilt, um die Überlastung eines Nachrichtenbusses zu vermeiden. Erfahren Sie mehr über ein Beispiel, in dem Kafka für die Anspruchsprüfungsgenerierung verwendet wird.	Integration
Datenstreaming mit AKS	Mit AKS können Sie auf einfache Weise einen Echtzeitdatenstrom mit Millionen von über Sensoren gesammelten Datenpunkten erfassen und verarbeiten. Kafka speichert Daten für die Analyse.	Container
Erfassungs-, ETL- und Streamverarbeitungspipelines mit Azure Databricks	Erstellen Sie ETL-Pipelines für Batch- und Streamingdaten mit Azure Databricks, um die Data Lake-Erfassung in beliebiger Größenordnung zu vereinfachen. Kafka ist eine Option zum Erfassen von Daten.	Analytics
Integrieren von Event Hubs in Azure Functions	Erfahren Sie, wie Sie effizienten und skalierbareren Code entwerfen, entwickeln und bereitstellen, der in Azure Functions ausgeführt wird und auf Azure Event Hubs-Ereignisse reagiert. Erfahren Sie, wie Ereignisse in Kafka-Themen beibehalten werden können.	Serverlos
IoT-Analysen mit Azure Data Explorer	Verwenden Sie Azure Data Explorer für IoT-Telemetrieanalysen in Quasi-Echtzeit für Streamingdaten mit hoher Übertragungsgeschwindigkeit und großem Durchsatz aus einer Vielzahl von Datenquellen einschließlich Kafka.	Analyse
Replikation von Mainframe- und Midrangedaten mit Qlik	Verwenden Sie Qlik Replicate, um Mainframe- und Midrangesysteme in die Cloud zu migrieren oder solche Systeme mit Cloudanwendungen zu erweitern. In dieser Lösung speichert Kafka Änderungsprotokollinformationen, die zum Replizieren der Datenspeicher verwendet werden.	Großrechner
Muster und Implementierungen bei der Cloudtransformation für das Bankwesen	Erfahren Sie mehr über die Muster und Implementierungen, die zum Transformieren eines Banksystems für die Cloud verwendet werden. Ein Kafka-Scaler wird verwendet, um zu erkennen, ob die Lösung die Anwendungsbereitstellung aktivieren oder deaktivieren muss.	Serverlos
Herausgeber-Abonnent-Muster	Erfahren Sie mehr über das Herausgeber-Abonnent-Muster, das es einer Anwendung ermöglicht, vielen interessierten Benutzern Ereignisse asynchron ankündigen zu können. Kafka wird für Messaging empfohlen.	Integration
Ratenbegrenzungsmuster	Verwenden Sie ein Ratenbegrenzungsmuster, um Drosselungsfehler zu vermeiden oder zu minimieren. Dieses Muster kann Kafka für Messaging implementieren.	Integration
Umgestalten von Mainframeanwendungen mit Advanced	Erfahren Sie, wie Sie die automatisierte COBOL-Refactoringlösung von Advanced verwenden, um Ihre COBOL-Mainframeanwendungen zu modernisieren, sie in Azure auszuführen und Kosten zu senken. Kafka kann als Datenquelle verwendet werden.	Großrechner
Streamverarbeitung mit vollständig verwalteten Open-Source-Daten-Engines	Streamen von Ereignissen mithilfe vollständig verwalteter Azure-Datendienste. Verwenden Sie Open-Source-Technologien wie Kafka, Kubernetes, Cassandra, PostgreSQL und Redis-Komponenten.	Analyse

Apache MapReduce

Aufbau	Zusammenfassung	Technologieschwerpunkt
Asynchrone Messagingoptionen	Erfahren Sie mehr über asynchrone Messagingoptionen in Azure. Sie können MapReduce verwenden, um Berichte zu Ereignissen zu generieren, die von Event Hubs erfasst werden.	Integration
Big Data-Architekturen	Enthält eine Beschreibung der Big Data-Architekturen, mit denen die Erfassung, Verarbeitung und Analyse von Daten durchgeführt wird, die für herkömmliche Datenbanksysteme zu groß oder zu komplex sind. Sie können MapReduce für Batchverarbeitung verwenden sowie zum Bereitstellen von Funktionen für parallele Vorgänge in diesen Szenarien.	Datenbanken
Auswählen einer Batchverarbeitungstechnologie	Erfahren Sie mehr über Technologien für Big Data-Batchverarbeitung in Azure, einschließlich HDInsight mit MapReduce.	Analyse
Geografische Knoten	Es wird beschrieben, wie Sie Back-End-Dienste für eine Gruppe von geografischen Knoten bereitstellen, von denen jeweils die Clientanforderungen einer beliebigen Region verarbeitet werden können. Dieses Muster tritt in Big Data-Architekturen auf, die MapReduce zur Konsolidierung von Ergebnissen von verschiedenen Computern verwenden.	Datenbanken
Minimieren der Koordination	Befolgen Sie diese Empfehlungen, um die Skalierbarkeit durch Minimierung der Koordination zwischen Anwendungsdiensten zu verbessern. Verwenden Sie MapReduce, um Arbeit in unabhängige Aufgaben zu unterteilen.	Datenbanken

Apache NiFi

Aufbau	Zusammenfassung	Technologieschwerpunkt
Apache NiFi in Azure	Automatisieren von Datenflüssen mit Apache NiFi in Azure Verwenden Sie eine skalierbare, hochverfügbare Lösung, um Daten in die Cloud oder in den Speicher und zwischen Cloudsystemen zu verschieben.	Analytics
Helm-basierte Bereitstellungen für Apache NiFi	Verwenden Sie Helm-Diagramme, wenn Sie NiFi in AKS bereitstellen. Helm optimiert den Installations- und Verwaltungsprozess für Kubernetes-Anwendungen.	Analytics
Überwachung mit Azure Data Explorer	Verwenden Sie Azure Data Explorer und NiFi in einer hybriden Überwachungslösung, die gestreamte und gebatchte Protokolle aus verschiedenen Quellen erfasst.	Analytics

Apache Oozie

Aufbau	Zusammenfassung	Technologieschwerpunkt
Big Data-Architekturen	Enthält eine Beschreibung der Big Data-Architekturen, mit denen die Erfassung, Verarbeitung und Analyse von Daten durchgeführt wird, die für herkömmliche Datenbanksysteme zu groß oder zu komplex sind. In diesen Szenarien können Sie Oozie für Orchestrierung verwenden.	Datenbanken
Wählen einer Technologie zur Orchestrierung von Datenpipelines	Erfahren Sie mehr über die wichtigsten Orchestrierungsfunktionen von Oozie.	Datenbanken

Apache Solr

Aufbau	Zusammenfassung	Technologieschwerpunkt
Auswählen eines Suchdatenspeichers	Erfahren Sie mehr über die Funktionen von Suchdatenspeichern in Azure und die wichtigsten Kriterien für die Auswahl eines Datenspeichers, der Ihren Anforderungen am besten entspricht. Erfahren Sie mehr über die wichtigsten Funktionen von HDInsight mit Solr.	Datenbanken

Apache Spark

Aufbau	Zusammenfassung	Technologieschwerpunkt
KI am Edge mit Azure Stack Hub	Bringen Sie Ihr trainiertes KI-Modell mit Azure Stack Hub zum Edge. Integrieren Sie es in Ihre Anwendungen, um Intelligence mit geringer Latenz zu ermöglichen. Verwenden Sie Spark zum Speichern von Daten.	KI
KI am Edge mit Azure Stack Hub: getrennt	Nutzen Sie die Leistung von Edge-KI, wenn Sie nicht mit dem Internet verbunden sind, und verlagern Sie Ihre KI-Modelle an den Edge – mit einer Lösung, die Azure Stack Hub umfasst. Verwenden Sie Spark zum Speichern von Daten.	KI
End-to-End-Analyse mit Azure Synapse	Erfahren Sie, wie Sie Azure Data Services verwenden, um eine moderne Analyseplattform zu entwickeln, mit der die gängigen Aufgaben der Datenverarbeitung bewältigt werden können. Die Spark Pools-Analyse-Engine ist aus Azure Synapse-Arbeitsbereichen verfügbar.	Analyse
Batchbewertung von Spark in Azure Databricks	Erstellen Sie eine skalierbare Lösung für die Batchbewertung eines Apache Spark-Klassifizierungsmodells.	KI
Big Data-Analysen für Confidential Computing	Verwenden Sie vertrauliches Computing in Kubernetes, um Big Data-Analysen mit Spark in vertraulichen Containern auszuführen, die durch Intel Software Guard-Erweiterungen geschützt sind.	Datenbanken
Big Data-Architekturen	Enthält eine Beschreibung der Big Data-Architekturen, mit denen die Erfassung, Verarbeitung und Analyse von Daten durchgeführt wird, die für herkömmliche Datenbanksysteme zu groß oder zu komplex sind. Sie können Spark für die Batch- oder Streamverarbeitung und als analytischen Datenspeicher verwenden.	Datenbanken
Auswählen einer Batchverarbeitungstechnologie	Vergleichen Sie die Technologieoptionen für die Big Data-Batchverarbeitung in Azure, einschließlich der Optionen für die Implementierung von Spark.	Analytics
Auswählen einer Technologie für die Datenstromverarbeitung	Vergleichen Sie die Optionen für Echtzeitverarbeitung von Nachrichtenstreams in Azure, einschließlich der Optionen für die Implementierung von Spark.	Analytics
Auswählen eines Analysedatenspeichers	Bewerten Sie Optionen für analytische Datenspeicher für Big Data in Azure. Erfahren Sie mehr über die Funktionen von Azure Synapse Spark-Pools.	Analyse
Data Science und maschinelles Lernen mit Azure Databricks	Verbessern von Vorgängen mit Azure Databricks, Delta Lake und MLflow für Data Science und maschinelles Lernen. Entwickeln, Trainieren und Bereitstellen von Machine Learning-Modellen. Azure Databricks bietet verwaltete Spark-Cluster.	KI
Extrahieren, Transformieren und Laden	Enthält eine Beschreibung der Datentransformationspipelines vom Typ ETL (Extrahieren/Transformieren/Laden) und ELT (Extrahieren/Laden/Transformieren) und der Nutzung von Ablaufsteuerungen und Datenflüssen. In ELT können Sie Spark verwenden, um Quelldaten abzufragen. Sie können Hive auch zusammen mit Hadoop als Datenspeicher verwenden.	Datenbanken
IoT mit Azure Cosmos DB	Erfahren Sie, wie Sie Azure Cosmos DB nutzen können, um verschiedene und unvorhersehbare IoT-Workloads ohne Einbußen bei der Erfassung oder Abfrageleistung zu bewältigen. Azure Databricks führt Spark-Streaming aus und verarbeitet Ereignisdaten von Geräten.	IoT
Kreditausbuchungsprognose mit HDInsight Spark	Verwenden Sie HDInsight und maschinelles Lernen, um die Wahrscheinlichkeit von Kreditausbuchungen vorherzusagen.	Datenbanken
Multi-Model-Machine Learning mit Spark	Erfahren Sie mehr über Machine Learning mit mehreren Modellen in Azure.	KI
Microsoft-Produkte für maschinelles Lernen	Vergleichen Sie die Optionen zum Erstellen, Bereitstellen und Verwalten Ihrer Machine Learning-Modelle, einschließlich der Azure Databricks Spark-basierten Analyseplattform und SynapseML.	KI
Modernes Data Warehouse für kleine und mittlere Unternehmen	Verwenden Sie Azure Synapse, Azure SQL-Datenbank und Azure Data Lake Storage, um Legacydaten und lokale Daten von kleinen und mittleren Unternehmen zu modernisieren. Tools im Azure Synapse-Arbeitsbereich können Spark-Computefunktionen verwenden, um Daten zu verarbeiten.	Analytics
Technologie zur Verarbeitung von natürlicher Sprache	Hier wird beschrieben, wie Sie einen Dienst zur Verarbeitung natürlicher Sprache für Aufgaben wie die Standpunktanalyse, Textgegenstands- und Spracherkennung, Schlüsselbegriffserkennung und Dokumentkategorisierung auswählen. Erfahren Sie mehr über die wichtigsten Funktionen von Azure HDInsight mit Spark.	KI
Beobachtbarkeitsmuster und -metriken	Erfahren Sie, wie Sie über Beobachtbarkeitsmuster und -metriken die Verarbeitungsleistung eines Big Data-Systems mithilfe von Azure Databricks verbessern. Die Azure Databricks-Überwachungsbibliothek streamt Spark-Ereignisse und Spark Structured Streaming-Metriken aus Aufträgen.	Datenbanken
Streamverarbeitung mit vollständig verwalteten Open-Source-Daten-Engines	Streamen von Ereignissen mithilfe vollständig verwalteter Azure-Datendienste. Verwenden Sie Open-Source-Technologien wie Spark, Kafka, Kubernetes, Cassandra, PostgreSQL und Redis-Komponenten.	Analytics

Apache Sqoop

Aufbau	Zusammenfassung	Technologieschwerpunkt
Big Data-Architekturen	Enthält eine Beschreibung der Big Data-Architekturen, mit denen die Erfassung, Verarbeitung und Analyse von Daten durchgeführt wird, die für herkömmliche Datenbanksysteme zu groß oder zu komplex sind. In diesen Szenarien können Sie Sqoop verwenden, um Orchestrierungsworkflows zu automatisieren.	Datenbanken
Auswählen einer Datenübertragungstechnologie	Erfahren Sie mehr über Datenübertragungsoptionen wie Azure Import/Export, Data Box und Sqoop.	Datenbanken

Apache ZooKeeper

Aufbau	Zusammenfassung	Technologieschwerpunkt
Apache NiFi in Azure	Automatisieren Sie Datenflüsse mit NiFi in Azure. Verwenden Sie eine skalierbare, hochverfügbare Lösung, um Daten in die Cloud oder in den Speicher und zwischen Cloudsystemen zu verschieben. In dieser Lösung verwendet NiFi ZooKeeper, um den Datenfluss zu koordinieren.	Analytics
Helm-basierte Bereitstellungen für Apache NiFi	Verwenden Sie Helm-Diagramme, wenn Sie NiFi in AKS bereitstellen. Helm optimiert den Installations- und Verwaltungsprozess für Kubernetes-Anwendungen. In dieser Architektur bietet ZooKeeper Clusterkoordination.	Analytics
Ratenbegrenzungsmuster	Verwenden Sie ein Ratenbegrenzungsmuster, um Drosselungsfehler zu vermeiden oder zu minimieren. In diesem Szenario können Sie ZooKeeper verwenden, um ein System zu erstellen, das temporäre Leases für die Kapazität gewährt.	Integration

Freigeben über

Apache-Open-Source-Szenarien in Azure

Apache Cassandra

Apache CouchDB

Apache Hadoop

Apache HBase

Apache Hive

Apache JMeter

Apache Kafka

Apache MapReduce

Apache NiFi

Apache Oozie

Apache Solr

Apache Spark

Apache Sqoop

Apache ZooKeeper

Feedback

Zusätzliche Ressourcen

Freigeben über

Apache-Open-Source-Szenarien in Azure

Apache Cassandra

Apache CouchDB

Apache Hadoop

Apache HBase

Apache Hive

Apache JMeter

Apache Kafka

Apache MapReduce

Apache NiFi

Apache Oozie

Apache Solr

Apache Spark

Apache Sqoop

Apache ZooKeeper

Zugehörige Ressourcen

Feedback

Zusätzliche Ressourcen