Freigeben über


Apache-Open-Source-Szenarien in Azure

Microsoft ist stolz darauf, Open-Source-Projekte, -Initiativen und -Stiftungen zu unterstützen und zu Tausenden von Open-Source-Communitys beizutragen. Mithilfe von Open-Source-Technologien in Azure können Sie Anwendungen auf Ihre Weise ausführen und gleichzeitig Ihre Investitionen optimieren.

Dieser Artikel enthält eine Zusammenfassung von Architekturen und Lösungen, bei denen Azure zusammen mit Apache-Open-Source-Lösungen verwendet wird.

Apache®, Apache Ignite, Ignite und das Flammenlogo sind entweder eingetragene Marken oder Marken der Apache Software Foundation in den USA und/oder anderen Ländern. Die Verwendung dieser Markierungen impliziert kein Endorsement durch die Apache Software Foundation.

Apache Cassandra

Aufbau Zusammenfassung Technologieschwerpunkt
Leitfaden zur Datenpartitionierung Hier finden Sie einen Leitfaden zur Trennung von Datenpartitionen für separate Verwaltung und separaten Zugriff. Des Weiteren finden Sie hier grundlegende Informationen zu horizontalen, vertikalen und funktionalen Partitionierungsstrategien. Cassandra eignet sich ideal für vertikale Partitionierung. Datenbanken
Hochverfügbarkeit im öffentlichen Azure MEC Erfahren Sie, wie Sie Workloads im Aktiv/Standby-Modus bereitstellen, um Hochverfügbarkeit und Notfallwiederherstellung im öffentlichen Azure-Multi-Access-Edgecompute zu erreichen. Cassandra kann zur Unterstützung von Georeplikation verwendet werden. Hybrid
N-schichtige Anwendung mit Apache Cassandra Hier erfahren Sie, wie Sie Linux-VMs und ein virtuelles Netzwerk bereitstellen, das für eine n-schichtige Architektur mit Apache Cassandra konfiguriert ist. Datenbanken
Nicht relationale Daten und NoSQL Enthält eine Beschreibung von nicht relationalen Datenbanken, in denen Daten je nach den Anforderungen als Schlüssel-Wert-Paare, Graphen, Zeitreihen, Objekte oder mit anderen Speichermodellen gespeichert werden. Azure Cosmos DB for Apache Cassandra ist ein empfohlener Azure-Dienst. Datenbanken
Ausführen von Apache Cassandra auf Azure-VMs Untersuchen von Überlegungen zur Leistung beim Ausführen von Apache Cassandra auf virtuellen Azure-Computern. Verwenden Sie diese Empfehlungen als Baseline für Tests Ihrer Workload. Datenbanken
Streamverarbeitung mit vollständig verwalteten Open-Source-Daten-Engines Streamen von Ereignissen mithilfe vollständig verwalteter Azure-Datendienste. Verwenden Sie Open-Source-Technologien wie Kafka, Kubernetes, Cassandra, PostgreSQL und Redis-Komponenten. Analytics

Apache CouchDB

Aufbau Zusammenfassung Technologieschwerpunkt
Baselinewebanwendung mit Zonenredundanz Nutzen Sie die bewährten Praktiken in dieser Referenzarchitektur, um Redundanz, Skalierbarkeit und Leistung in einer Azure App Service-Webanwendung zu verbessern. CouchDB ist eine empfohlene Dokumentdatenbank. Web

Apache Hadoop

Aufbau Zusammenfassung Technologieschwerpunkt
KI am Edge mit Azure Stack Hub Bringen Sie Ihr trainiertes KI-Modell mit Azure Stack Hub zum Edge. Integrieren Sie es in Ihre Anwendungen, um Intelligence mit geringer Latenz zu ermöglichen. Verwenden Sie Hadoop zum Speichern von Daten. KI
KI am Edge mit Azure Stack Hub: getrennt Nutzen Sie die Leistung von Edge-KI, wenn Sie nicht mit dem Internet verbunden sind, und verlagern Sie Ihre KI-Modelle an den Edge – mit einer Lösung, die Azure Stack Hub umfasst. Verwenden Sie Hadoop zum Speichern von Daten. KI
Big Data-Architekturen Enthält eine Beschreibung der Big Data-Architekturen, mit denen die Erfassung, Verarbeitung und Analyse von Daten durchgeführt wird, die für herkömmliche Datenbanksysteme zu groß oder zu komplex sind. Azure HDInsight Hadoop-Cluster können für Batchverarbeitung verwendet werden. Datenbanken
Auswählen einer Datenübertragungstechnologie Enthält eine Beschreibung der Optionen für die Datenübertragung in Azure, z. B. Import/Export-Dienst, Azure Data Box, Azure Data Factory und Befehlszeilentools sowie Tools mit grafischer Benutzeroberfläche. Das Hadoop-Ökosystem stellt Tools für die Datenübertragung zur Verfügung. Datenbanken
Bürger-KI mit Power Platform Erfahren Sie, wie Sie mit Azure Machine Learning und Power Platform schnell einen Proof of Concept für maschinelles Lernen sowie eine Produktionsversion erstellen können. Azure Data Lake (ein Hadoop-kompatibles Dateisystem) speichert Daten. KI
Data considerations for microservices (Überlegungen zu Daten für Microservices) Erfahren Sie mehr über das Verwalten von Daten in einer Microservicearchitektur. Sehen Sie sich ein Beispiel an, in dem Azure Data Lake Store, ein Hadoop-Dateisystem, verwendet wird. Microservices
Extrahieren, Transformieren und Laden Enthält eine Beschreibung der Datentransformationspipelines vom Typ ETL (Extrahieren/Transformieren/Laden) und ELT (Extrahieren/Laden/Transformieren) und der Nutzung von Ablaufsteuerungen und Datenflüssen. Hadoop kann als Zieldatenspeicher in ELT-Prozessen verwendet werden. Analyse
IoT-Analyse- und Optimierungsschleifen In diesem Artikel erhalten Sie Informationen zu Analyse- und Optimierungsschleifen, ein IoT-Muster für das Generieren und Anwenden von Optimierungserkenntnissen, die auf einem gesamten Geschäftskontext basieren. Die Hadoop-Map-Reduce-Verarbeitung kann zum Verarbeiten von Big Data verwendet werden. IoT
Muster für materialisierte Sichten Generieren Sie vorab aufgefüllte Sichten für die Daten in mindestens einem Datenspeicher, wenn die Daten für Ihre erforderlichen Abfragevorgänge nicht ideal formatiert sind. Verwenden Sie Hadoop für einen Big Data-Speichermechanismus, der Indizierung unterstützt. Datenbanken
Vorhersagen von Kreditausbuchungen mit HDInsight Spark Verwenden Sie HDInsight und maschinelles Lernen, um die Wahrscheinlichkeit von Kreditausbuchungen vorherzusagen. HDInsight unterstützt Hadoop. Datenbanken

Apache HBase

Aufbau Zusammenfassung Technologieschwerpunkt
KI am Edge mit Azure Stack Hub Bringen Sie Ihr trainiertes KI-Modell mit Azure Stack Hub zum Edge. Integrieren Sie es in Ihre Anwendungen, um Intelligence mit geringer Latenz zu ermöglichen. Verwenden Sie HBase zum Speichern von Daten. KI
KI am Edge mit Azure Stack Hub: getrennt Nutzen Sie die Leistung von Edge-KI, wenn Sie nicht mit dem Internet verbunden sind, und verlagern Sie Ihre KI-Modelle an den Edge – mit einer Lösung, die Azure Stack Hub umfasst. Verwenden Sie HBase zum Speichern von Daten. KI
Big Data-Architekturen Enthält eine Beschreibung der Big Data-Architekturen, mit denen die Erfassung, Verarbeitung und Analyse von Daten durchgeführt wird, die für herkömmliche Datenbanksysteme zu groß oder zu komplex sind. In diesen Szenarien können Sie HBase für die Datenpräsentation verwenden. Datenbanken
Auswählen einer Big Data-Speichertechnologie Vergleichen Sie Big Data-Speichertechnologieoptionen in Azure. Enthält eine Erläuterung von HBase in HDInsight. Datenbanken
Auswählen eines Analysedatenspeichers Erfahren Sie mehr über die Verwendung von HBase für leistungsfähigen, zufälligen Zugriff und ein hohes Maß an Konsistenz für große Mengen an unstrukturierten und teilweise strukturierten Daten. Analytics
Anleitungen zur Datenpartitionierung Sehen Sie sich die Anleitungen zum Trennen von Datenpartitionen an, damit sie separat verwaltet und aufgerufen werden können. Des Weiteren finden Sie hier grundlegende Informationen zu horizontalen, vertikalen und funktionalen Partitionierungsstrategien. HBase eignet sich ideal für vertikale Partitionierung. Datenbanken
Nicht relationale Daten und NoSQL Enthält eine Beschreibung von nicht relationalen Datenbanken, in denen Daten je nach den Anforderungen als Schlüssel-Wert-Paare, Graphen, Zeitreihen, Objekte oder mit anderen Speichermodellen gespeichert werden. HBase kann für Spalten- und Zeitreihendaten verwendet werden. Datenbanken

Apache Hive

Aufbau Zusammenfassung Technologieschwerpunkt
Big Data-Architekturen Enthält eine Beschreibung der Big Data-Architekturen, mit denen die Erfassung, Verarbeitung und Analyse von Daten durchgeführt wird, die für herkömmliche Datenbanksysteme zu groß oder zu komplex sind. In diesen Szenarien können Sie Hive für Batchverarbeitung und Datenpräsentation verwenden. Datenbanken
Auswählen einer Batchverarbeitungstechnologie Vergleichen Sie die verschiedenen Technologien für Big Data-Batchverarbeitung in Azure. Informieren Sie sich über die Funktionen von Hive. Analytics
Auswählen eines Analysedatenspeichers Bewerten Sie Optionen für analytische Datenspeicher für Big Data in Azure. Informieren Sie sich über die Funktionen von Hive. Analyse
Extrahieren, Transformieren und Laden Erfahren Sie mehr über ETL- und ELT-Datentransformationspipelines und über die Verwendung von Ablaufsteuerungs- und Datenflüssen. In ELT können Sie Hive verwenden, um Quelldaten abzufragen. Sie können Hive auch zusammen mit Hadoop als Datenspeicher verwenden. Datenbanken
Kreditausbuchungsprognose mit HDInsight Spark-Clustern Verwenden Sie HDInsight und maschinelles Lernen, um die Wahrscheinlichkeit von Kreditausbuchungen vorherzusagen. Analyseergebnisse werden in Hive-Tabellen gespeichert. Analytics
Vorausschauende Flugzeugtriebwerksüberwachung Erfahren Sie, wie Echtzeit-Flugzeugdaten mit Analysen kombiniert werden, um eine Lösung für die vorausschauende Überwachung und Integritätsanalyse von Flugzeugtriebwerken zu erstellen. Hive-Skripts stellen Aggregationen für die von Azure Stream Analytics archivierten Ereignisrohdaten bereit. Analyse
Prognoseinformationen mit Verkehrstelematik Erfahren Sie, wie Autohändler, Hersteller und Versicherungsunternehmen Azure nutzen können, um prädiktive Erkenntnisse über den Fahrzeugzustand und Fahrgewohnheiten zu gewinnen. In dieser Lösung verwendet Azure Data Factory HDInsight, um Hive-Abfragen zum Verarbeiten und Laden von Daten auszuführen. Analyse
Skalierung von KI- und Machine-Learning-Initiativen in regulierten Branchen Erfahren Sie mehr über die Skalierung von Azure KI- und Machine Learning-Umgebungen, die umfangreiche Sicherheitsrichtlinien erfüllen müssen. Hive wird zum Speichern von Metadaten verwendet. KI

Apache JMeter

Aufbau Zusammenfassung Technologieschwerpunkt
Cloudtransformationslösung für ein Bankingsystem in Azure Verwenden Sie simulierte und tatsächliche Anwendungen sowie vorhandene Workloads, um die Reaktion einer Lösungsinfrastruktur auf Skalierbarkeit und Leistung zu überwachen. Eine benutzerdefinierte JMeter-Lösung wird für Auslastungstests verwendet. Migration
Muster und Implementierungen bei der Cloudtransformation für das Bankwesen Erfahren Sie mehr über die Muster und Implementierungen, die zum Transformieren eines Banksystems für die Cloud verwendet werden. JMeter wird für Auslastungstests verwendet. Migration
Skalierbare Cloudanwendungen und SRE Erstellen Sie skalierbare Cloudanwendungen, indem Sie die Leistungsmodellierung und andere SRE-Prinzipien und -Methoden (Site Reliability Engineering) nutzen. JMeter wird für Auslastungstests verwendet. Web

Apache Kafka

Aufbau Zusammenfassung Technologieschwerpunkt
Anwendungsdatensicherheit für AKS-Workloads in Azure NetApp Files Bereitstellen von Astra Control Service mit Azure NetApp Files für Datenschutz, Notfallwiederherstellung und Mobilität für AKS-Anwendungen (Azure Kubernetes Service) einschließlich Kafka-Anwendungen bereit. Container
Asynchrone Messagingoptionen Erfahren Sie mehr über asynchrone Messagingoptionen in Azure, einschließlich Unterstützung für Kafka-Clients. Integration
Steuerung einer Flotte von fahrerlosen Transportfahrzeugen Erfahren Sie mehr über einen End-to-End-Ansatz für einen OEM (Original Equipment Manufacturer) in der Automobilindustrie. Enthält mehrere Open-Source-Bibliotheken, die Sie wiederverwenden können. Back-End-Dienste in dieser Architektur können eine Verbindung mit Kafka herstellen. Web
Überwachung mit Azure Data Explorer Verwenden Sie Azure Data Explorer in einer hybriden Überwachungslösung, die gestreamte und gebatchte Protokolle aus Kafka und anderen Quellen erfasst. Analytics
Cloudtransformationslösung für ein Bankingsystem in Azure Verwenden Sie simulierte und tatsächliche Anwendungen sowie vorhandene Workloads, um die Reaktion einer Lösungsinfrastruktur auf Skalierbarkeit und Leistung zu überwachen. Ereignisse aus Event Hubs für Kafka werden in das System eingespeist. Container
Auswählen einer Technologie für die Datenstromverarbeitung Vergleichen Sie Optionen für die Echtzeitverarbeitung von Nachrichtenstreams in Azure, einschließlich der Kafka-Streams-API. Analytics
Muster für die Anspruchsprüfung Untersuchen des Claim Check-Musters, das eine große Nachricht in Claim Check und Nutzdaten aufteilt, um die Überlastung eines Nachrichtenbusses zu vermeiden. Erfahren Sie mehr über ein Beispiel, in dem Kafka für die Anspruchsprüfungsgenerierung verwendet wird. Integration
Datenstreaming mit AKS Mit AKS können Sie auf einfache Weise einen Echtzeitdatenstrom mit Millionen von über Sensoren gesammelten Datenpunkten erfassen und verarbeiten. Kafka speichert Daten für die Analyse. Container
Erfassungs-, ETL- und Streamverarbeitungspipelines mit Azure Databricks Erstellen Sie ETL-Pipelines für Batch- und Streamingdaten mit Azure Databricks, um die Data Lake-Erfassung in beliebiger Größenordnung zu vereinfachen. Kafka ist eine Option zum Erfassen von Daten. Analytics
Integrieren von Event Hubs in Azure Functions Erfahren Sie, wie Sie effizienten und skalierbareren Code entwerfen, entwickeln und bereitstellen, der in Azure Functions ausgeführt wird und auf Azure Event Hubs-Ereignisse reagiert. Erfahren Sie, wie Ereignisse in Kafka-Themen beibehalten werden können. Serverlos
IoT-Analysen mit Azure Data Explorer Verwenden Sie Azure Data Explorer für IoT-Telemetrieanalysen in Quasi-Echtzeit für Streamingdaten mit hoher Übertragungsgeschwindigkeit und großem Durchsatz aus einer Vielzahl von Datenquellen einschließlich Kafka. Analyse
Replikation von Mainframe- und Midrangedaten mit Qlik Verwenden Sie Qlik Replicate, um Mainframe- und Midrangesysteme in die Cloud zu migrieren oder solche Systeme mit Cloudanwendungen zu erweitern. In dieser Lösung speichert Kafka Änderungsprotokollinformationen, die zum Replizieren der Datenspeicher verwendet werden. Großrechner
Muster und Implementierungen bei der Cloudtransformation für das Bankwesen Erfahren Sie mehr über die Muster und Implementierungen, die zum Transformieren eines Banksystems für die Cloud verwendet werden. Ein Kafka-Scaler wird verwendet, um zu erkennen, ob die Lösung die Anwendungsbereitstellung aktivieren oder deaktivieren muss. Serverlos
Herausgeber-Abonnent-Muster Erfahren Sie mehr über das Herausgeber-Abonnent-Muster, das es einer Anwendung ermöglicht, vielen interessierten Benutzern Ereignisse asynchron ankündigen zu können. Kafka wird für Messaging empfohlen. Integration
Ratenbegrenzungsmuster Verwenden Sie ein Ratenbegrenzungsmuster, um Drosselungsfehler zu vermeiden oder zu minimieren. Dieses Muster kann Kafka für Messaging implementieren. Integration
Umgestalten von Mainframeanwendungen mit Advanced Erfahren Sie, wie Sie die automatisierte COBOL-Refactoringlösung von Advanced verwenden, um Ihre COBOL-Mainframeanwendungen zu modernisieren, sie in Azure auszuführen und Kosten zu senken. Kafka kann als Datenquelle verwendet werden. Großrechner
Streamverarbeitung mit vollständig verwalteten Open-Source-Daten-Engines Streamen von Ereignissen mithilfe vollständig verwalteter Azure-Datendienste. Verwenden Sie Open-Source-Technologien wie Kafka, Kubernetes, Cassandra, PostgreSQL und Redis-Komponenten. Analyse

Apache MapReduce

Aufbau Zusammenfassung Technologieschwerpunkt
Asynchrone Messagingoptionen Erfahren Sie mehr über asynchrone Messagingoptionen in Azure. Sie können MapReduce verwenden, um Berichte zu Ereignissen zu generieren, die von Event Hubs erfasst werden. Integration
Big Data-Architekturen Enthält eine Beschreibung der Big Data-Architekturen, mit denen die Erfassung, Verarbeitung und Analyse von Daten durchgeführt wird, die für herkömmliche Datenbanksysteme zu groß oder zu komplex sind. Sie können MapReduce für Batchverarbeitung verwenden sowie zum Bereitstellen von Funktionen für parallele Vorgänge in diesen Szenarien. Datenbanken
Auswählen einer Batchverarbeitungstechnologie Erfahren Sie mehr über Technologien für Big Data-Batchverarbeitung in Azure, einschließlich HDInsight mit MapReduce. Analyse
Geografische Knoten Es wird beschrieben, wie Sie Back-End-Dienste für eine Gruppe von geografischen Knoten bereitstellen, von denen jeweils die Clientanforderungen einer beliebigen Region verarbeitet werden können. Dieses Muster tritt in Big Data-Architekturen auf, die MapReduce zur Konsolidierung von Ergebnissen von verschiedenen Computern verwenden. Datenbanken
Minimieren der Koordination Befolgen Sie diese Empfehlungen, um die Skalierbarkeit durch Minimierung der Koordination zwischen Anwendungsdiensten zu verbessern. Verwenden Sie MapReduce, um Arbeit in unabhängige Aufgaben zu unterteilen. Datenbanken

Apache NiFi

Aufbau Zusammenfassung Technologieschwerpunkt
Apache NiFi in Azure Automatisieren von Datenflüssen mit Apache NiFi in Azure Verwenden Sie eine skalierbare, hochverfügbare Lösung, um Daten in die Cloud oder in den Speicher und zwischen Cloudsystemen zu verschieben. Analytics
Helm-basierte Bereitstellungen für Apache NiFi Verwenden Sie Helm-Diagramme, wenn Sie NiFi in AKS bereitstellen. Helm optimiert den Installations- und Verwaltungsprozess für Kubernetes-Anwendungen. Analytics
Überwachung mit Azure Data Explorer Verwenden Sie Azure Data Explorer und NiFi in einer hybriden Überwachungslösung, die gestreamte und gebatchte Protokolle aus verschiedenen Quellen erfasst. Analytics

Apache Oozie

Aufbau Zusammenfassung Technologieschwerpunkt
Big Data-Architekturen Enthält eine Beschreibung der Big Data-Architekturen, mit denen die Erfassung, Verarbeitung und Analyse von Daten durchgeführt wird, die für herkömmliche Datenbanksysteme zu groß oder zu komplex sind. In diesen Szenarien können Sie Oozie für Orchestrierung verwenden. Datenbanken
Wählen einer Technologie zur Orchestrierung von Datenpipelines Erfahren Sie mehr über die wichtigsten Orchestrierungsfunktionen von Oozie. Datenbanken

Apache Solr

Aufbau Zusammenfassung Technologieschwerpunkt
Auswählen eines Suchdatenspeichers Erfahren Sie mehr über die Funktionen von Suchdatenspeichern in Azure und die wichtigsten Kriterien für die Auswahl eines Datenspeichers, der Ihren Anforderungen am besten entspricht. Erfahren Sie mehr über die wichtigsten Funktionen von HDInsight mit Solr. Datenbanken

Apache Spark

Aufbau Zusammenfassung Technologieschwerpunkt
KI am Edge mit Azure Stack Hub Bringen Sie Ihr trainiertes KI-Modell mit Azure Stack Hub zum Edge. Integrieren Sie es in Ihre Anwendungen, um Intelligence mit geringer Latenz zu ermöglichen. Verwenden Sie Spark zum Speichern von Daten. KI
KI am Edge mit Azure Stack Hub: getrennt Nutzen Sie die Leistung von Edge-KI, wenn Sie nicht mit dem Internet verbunden sind, und verlagern Sie Ihre KI-Modelle an den Edge – mit einer Lösung, die Azure Stack Hub umfasst. Verwenden Sie Spark zum Speichern von Daten. KI
End-to-End-Analyse mit Azure Synapse Erfahren Sie, wie Sie Azure Data Services verwenden, um eine moderne Analyseplattform zu entwickeln, mit der die gängigen Aufgaben der Datenverarbeitung bewältigt werden können. Die Spark Pools-Analyse-Engine ist aus Azure Synapse-Arbeitsbereichen verfügbar. Analyse
Batchbewertung von Spark in Azure Databricks Erstellen Sie eine skalierbare Lösung für die Batchbewertung eines Apache Spark-Klassifizierungsmodells. KI
Big Data-Analysen für Confidential Computing Verwenden Sie vertrauliches Computing in Kubernetes, um Big Data-Analysen mit Spark in vertraulichen Containern auszuführen, die durch Intel Software Guard-Erweiterungen geschützt sind. Datenbanken
Big Data-Architekturen Enthält eine Beschreibung der Big Data-Architekturen, mit denen die Erfassung, Verarbeitung und Analyse von Daten durchgeführt wird, die für herkömmliche Datenbanksysteme zu groß oder zu komplex sind. Sie können Spark für die Batch- oder Streamverarbeitung und als analytischen Datenspeicher verwenden. Datenbanken
Auswählen einer Batchverarbeitungstechnologie Vergleichen Sie die Technologieoptionen für die Big Data-Batchverarbeitung in Azure, einschließlich der Optionen für die Implementierung von Spark. Analytics
Auswählen einer Technologie für die Datenstromverarbeitung Vergleichen Sie die Optionen für Echtzeitverarbeitung von Nachrichtenstreams in Azure, einschließlich der Optionen für die Implementierung von Spark. Analytics
Auswählen eines Analysedatenspeichers Bewerten Sie Optionen für analytische Datenspeicher für Big Data in Azure. Erfahren Sie mehr über die Funktionen von Azure Synapse Spark-Pools. Analyse
Data Science und maschinelles Lernen mit Azure Databricks Verbessern von Vorgängen mit Azure Databricks, Delta Lake und MLflow für Data Science und maschinelles Lernen. Entwickeln, Trainieren und Bereitstellen von Machine Learning-Modellen. Azure Databricks bietet verwaltete Spark-Cluster. KI
Extrahieren, Transformieren und Laden Enthält eine Beschreibung der Datentransformationspipelines vom Typ ETL (Extrahieren/Transformieren/Laden) und ELT (Extrahieren/Laden/Transformieren) und der Nutzung von Ablaufsteuerungen und Datenflüssen. In ELT können Sie Spark verwenden, um Quelldaten abzufragen. Sie können Hive auch zusammen mit Hadoop als Datenspeicher verwenden. Datenbanken
IoT mit Azure Cosmos DB Erfahren Sie, wie Sie Azure Cosmos DB nutzen können, um verschiedene und unvorhersehbare IoT-Workloads ohne Einbußen bei der Erfassung oder Abfrageleistung zu bewältigen. Azure Databricks führt Spark-Streaming aus und verarbeitet Ereignisdaten von Geräten. IoT
Kreditausbuchungsprognose mit HDInsight Spark Verwenden Sie HDInsight und maschinelles Lernen, um die Wahrscheinlichkeit von Kreditausbuchungen vorherzusagen. Datenbanken
Multi-Model-Machine Learning mit Spark Erfahren Sie mehr über Machine Learning mit mehreren Modellen in Azure. KI
Microsoft-Produkte für maschinelles Lernen Vergleichen Sie die Optionen zum Erstellen, Bereitstellen und Verwalten Ihrer Machine Learning-Modelle, einschließlich der Azure Databricks Spark-basierten Analyseplattform und SynapseML. KI
Modernes Data Warehouse für kleine und mittlere Unternehmen Verwenden Sie Azure Synapse, Azure SQL-Datenbank und Azure Data Lake Storage, um Legacydaten und lokale Daten von kleinen und mittleren Unternehmen zu modernisieren. Tools im Azure Synapse-Arbeitsbereich können Spark-Computefunktionen verwenden, um Daten zu verarbeiten. Analytics
Technologie zur Verarbeitung von natürlicher Sprache Hier wird beschrieben, wie Sie einen Dienst zur Verarbeitung natürlicher Sprache für Aufgaben wie die Standpunktanalyse, Textgegenstands- und Spracherkennung, Schlüsselbegriffserkennung und Dokumentkategorisierung auswählen. Erfahren Sie mehr über die wichtigsten Funktionen von Azure HDInsight mit Spark. KI
Beobachtbarkeitsmuster und -metriken Erfahren Sie, wie Sie über Beobachtbarkeitsmuster und -metriken die Verarbeitungsleistung eines Big Data-Systems mithilfe von Azure Databricks verbessern. Die Azure Databricks-Überwachungsbibliothek streamt Spark-Ereignisse und Spark Structured Streaming-Metriken aus Aufträgen. Datenbanken
Streamverarbeitung mit vollständig verwalteten Open-Source-Daten-Engines Streamen von Ereignissen mithilfe vollständig verwalteter Azure-Datendienste. Verwenden Sie Open-Source-Technologien wie Spark, Kafka, Kubernetes, Cassandra, PostgreSQL und Redis-Komponenten. Analytics

Apache Sqoop

Aufbau Zusammenfassung Technologieschwerpunkt
Big Data-Architekturen Enthält eine Beschreibung der Big Data-Architekturen, mit denen die Erfassung, Verarbeitung und Analyse von Daten durchgeführt wird, die für herkömmliche Datenbanksysteme zu groß oder zu komplex sind. In diesen Szenarien können Sie Sqoop verwenden, um Orchestrierungsworkflows zu automatisieren. Datenbanken
Auswählen einer Datenübertragungstechnologie Erfahren Sie mehr über Datenübertragungsoptionen wie Azure Import/Export, Data Box und Sqoop. Datenbanken

Apache ZooKeeper

Aufbau Zusammenfassung Technologieschwerpunkt
Apache NiFi in Azure Automatisieren Sie Datenflüsse mit NiFi in Azure. Verwenden Sie eine skalierbare, hochverfügbare Lösung, um Daten in die Cloud oder in den Speicher und zwischen Cloudsystemen zu verschieben. In dieser Lösung verwendet NiFi ZooKeeper, um den Datenfluss zu koordinieren. Analytics
Helm-basierte Bereitstellungen für Apache NiFi Verwenden Sie Helm-Diagramme, wenn Sie NiFi in AKS bereitstellen. Helm optimiert den Installations- und Verwaltungsprozess für Kubernetes-Anwendungen. In dieser Architektur bietet ZooKeeper Clusterkoordination. Analytics
Ratenbegrenzungsmuster Verwenden Sie ein Ratenbegrenzungsmuster, um Drosselungsfehler zu vermeiden oder zu minimieren. In diesem Szenario können Sie ZooKeeper verwenden, um ein System zu erstellen, das temporäre Leases für die Kapazität gewährt. Integration