Übersicht über die Zielzone der Datenverwaltung für Analysen auf Cloudebene

Die Zielzone für die Datenverwaltung ist eine Verwaltungsfunktion und steht im Mittelpunkt der Cloud-Analytik. Sie ist verantwortlich für die Governance Ihrer Analyseplattform.

Diagram of data management landing zone overview.

Ihre Zielzone für die Datenverwaltung ist ein separates Abonnement, das die gleichen Standarddienste der Azure-Zielzone bietet. Sie ermöglicht Data Governance Ihrer Daten über Crawler, die sich mit Ihren Data Lakes und polyglotter Speicherung in Ihren Datenzielzonen verbinden. Virtuelles Netzwerk-Peering verbindet Ihre Datenverwaltungs-Zielzone mit Ihren Daten-Zielzonen und Konnektivitäts-Abonnements.

Verwenden Sie diese Architektur als Ausgangspunkt. Laden Sie die Visio-Datei herunter, und passen Sie sie im Zuge der Planung Ihrer Zielzonenimplementierung für die Datenverwaltung an Ihre spezifischen geschäftlichen und technischen Anforderungen an.

Hinweis

Mehrsprachige Persistenz ist ein Begriff aus dem Bereich der Datenspeicherung, der Ihre Wahl zwischen verschiedenen Datenspeicherungs-/Datenspeichertechnologien zur Unterstützung Ihrer verschiedenen Datentypen und deren Speicheranforderungen beschreibt. Mehrsprachige Persistenz ist im Wesentlichen das Konzept, dass eine Anwendung mehr als eine Kerndatenbank oder Speichertechnologie verwenden kann.

Wichtig

Ihre Datenverwaltungszielzone muss als separates Abonnement unter einer Verwaltungsgruppe mit der entsprechenden Governance bereitgestellt werden. Anschließend können Sie die Governance in Ihrer Organisation steuern. Der Azure-Zielzonenbeschleuniger veranschaulicht, wie Sie Azure-Zielzonen angehen sollten.

Datenkatalog

Ressourcengruppe: governance-rg

Der Datenkatalog registriert und pflegt die Dateninformationen an einem zentralen Ort und macht sie für die Organisation verfügbar. Dadurch wird sichergestellt, dass Unternehmen doppelte Datenprodukte vermeiden, die durch redundante Datenerfassung durch verschiedene Projektteams verursacht werden.

Es wird empfohlen, einen Data Catalog-Dienst bereitzustellen, um die Metadaten der in den Datenzielzonen gespeicherten Datenprodukte zu definieren.

Die Analyse auf Cloudebene stützt sich auf Azure Purview und dient als:

  • Registrierungssystem
  • Ermittlung von Unternehmensdatenquellen
  • Datenklassifizierungsmodul
  • Richtlinienspeicher
  • API zum Registrieren und Lesen von Dateninformationen
  • Compliance-Dashboard-Hub

Da der Datenkatalog Teil der Zielzone für die Datenverwaltung ist, kann er über sein virtuelles Netzwerk (VNet) Peering und selbstgehosteten Integration Runtimes mit jeder Datenzielzone kommunizieren. Das Ermitteln von Datenprodukten in lokalen Speichern und anderen öffentlichen Clouds wird durch weitere Bereitstellungen von selbstgehosteten Integration Runtimes erreicht.

Hinweis

Obwohl sich diese Dokumentation in erster Linie auf die Verwendung von Microsoft Purview für Datenkatalogfunktionen und Datenklassifizierung konzentriert, haben Unternehmen möglicherweise in andere Produkte wie Alation, Okera oder Collibra investiert. Wenn dies der Fall ist, arbeiten Sie mit Ihrem Anbieter zusammen, um die beschriebenen Prinzipien für eine Zielzone für die Datenverwaltung auf möglichst ähnliche Weise anzuwenden. Beachten Sie, dass möglicherweise organisationsspezifische Integrationsmaßnahmen erforderlich sind.

Weitere Informationen finden Sie unter Datenkatalog sowie unter Bewährte Methoden für die Microsoft Purview-Bereitstellung für Cloud-Skalierungsanalysen.

Datenqualitätsverwaltung

Ressourcengruppe: governance-rg2

Fahren Sie mit Ihrer aktuellen Lösung fort.

Sie sollten die Datenqualität so nah wie möglich verwalten, damit Sie qualitätsbezogene Probleme vermeiden, die sich über Ihre Analysen und KI-Immobilien hinweg wiederholen. Indem Qualitätsmetriken und Validierungen Teil Ihrer Datenintegration werden, wird der Qualitätsprozess auf die Teams abgestimmt, die Ihren Daten am nächsten sind. Diese Teams verfügen über das beste Verständnis Ihres Datenassets.

Die Datenherkunft schafft auch Vertrauen in die Datenqualität. Sie sollten sie für alle Datenprodukte und Produkte bereitstellen.

Weitere Informationen zur Datenqualitätsverwaltung finden Sie unter Datenqualität.

Datenmodellierungs-Repository

Ressourcengruppe: governance-rg2

Sie sollten Entity-Relationship-Modelle an einem zentralen Ort in Ihrer Zielzone für die Datenverwaltung erfassen und speichern. Dies bietet Datenverbrauchern einen einzigen Ort, um konzeptionelle Diagramme zu finden.

Viele Kunden verwenden ER Studio und iServer, um ihre Datenprodukte vor der Aufnahme zu modellieren.

Masterdatenverwaltung

Ressourcengruppe: governance-rg2

Die Masterdatenverwaltungssteuerung befindet sich in der Zielzone für die Datenverwaltung. Die Masterdatenverwaltung im Data Mesh enthält bestimmte Überlegungen, die Sie für Data Mesh aufrufen sollten.

Viele Lösungen zur Masterdatenverwaltung sind vollständig in Microsoft Entra ID integriert. Diese Integration ermöglicht es Ihnen, Ihre Daten zu schützen und unterschiedliche Ansichten für verschiedene Benutzergruppen bereitzustellen.

Weitere Informationen finden Sie unter Master Data Management System.

API-Katalog

Ressourcengruppe: governance-rg2

Ihre Datenanwendungsteams werden wahrscheinlich verschiedene APIs für ihre Datenanwendung erstellen. Diese APIs können in anderen Teilen Ihrer Organisation schwer zu finden sein. Ein API-Katalog in Ihrer Datenverwaltungszielzone kann helfen, dieses Problem zu lösen.

Ein API-Katalog unterstützt die Standardisierung Ihrer Dokumentation und bietet einen Ort für die interne Zusammenarbeit an APIs. Er kann auch Steuermechanismen für Nutzung, Veröffentlichung und Governance in Ihrer gesamten Organisation fördern.

Datenfreigabe und Verträge

Ressourcengruppe: governance-rg2

Analysen auf Cloudebene verwenden die Microsoft Entra-Berechtigungsverwaltung oder Microsoft Purview-Richtlinien, um den Zugriff auf die Datenfreigabe zu steuern. Selbst dann benötigen Sie möglicherweise noch eine Freigabe und ein Vertrags-Repository. Dieses Repository ist eine Organisationsfunktion und sollte sich in Ihrer Zielzone für die Datenverwaltung befinden.

Ihre Verträge sollten Informationen über Datenvalidierung, Modelle und Sicherheitsrichtlinien enthalten.

Weitere Informationen finden Sie unter Datenverträge

Azure Container Registry

Ressourcengruppe: container-rg

Ihre Datenverwaltungszielzone hostet eine Azure Container Registry. Mit dem Azure Container Registry können Ihre Datenplattformvorgänge Standardcontainer für die Verwendung in Data Science-Projekten bereitstellen, die Ihre Datenanwendungsteams nutzen.

Ressourcengruppe: synapse-link-rg

Bei Private Link-Hubs (also Hubs für private Verbindungen) von Azure Synapse Analytics handelt es sich um Azure-Ressourcen, die Ihr geschütztes Netzwerk und die Azure Synapse Studio-Weboberfläche verbinden. Cloud-Skalierungsanalysen verbindet Ihr Azure-Virtual Network sicher mit Azure Synapse Studio mit privaten Links aus diesen Hubs.

Sie müssen zwei Schritte ausführen, um über private Verbindungen eine Verbindung mit dem Azure Synapse-Studio herzustellen.

  1. Erstellen Sie eine Private Link Hubressource.
  2. Erstellen Sie einen privaten Endpunkt, der über eine Verbindung zwischen Ihrem virtuellen Azure-Netzwerk und diesem Private Link-Hub verfügt.

Sie können private Endpunkte dann für die sichere Kommunikation mit dem Azure Synapse-Studio verwenden. Integrieren Sie diese privaten Endpunkte mit Ihrer DNS-Lösung. Dies kann entweder Ihre lokale Lösung oder Azure Privates DNS sein.

Siehe dazu Verbinden zu Azure Synapse Studio mithilfe von privaten Links.

Automatisierungsschnittstellen (optional)

Ihre Organisation kann entscheiden, viele Automatisierungsdienste zu erstellen, um Cloud-Skalierungsanalysefunktionen zu erweitern. Diese Automatisierungsdienste fördern die Konformitäts- und Onboardinglösungen für Ihren Analysezustand.

Wenn Sie sich entscheiden, diese Automatisierungsdienste zu erstellen, sollten Sie über eine Benutzeroberfläche verfügen, die sowohl als Datenmarkt als auch als Betriebskonsole fungiert. Diese Schnittstelle sollte auf einem zugrunde liegenden Metadatenspeicher basieren, wie zuvor in Metadatenstandards beschrieben.

Der Datenmarkt oder die Betriebskonsole ruft eine mittlere Ebene von Microservices auf, um das Onboarding, die Metadatenregistrierung, die Sicherheitsbereitstellung, den Datenlebenszyklus und die Sichtbarkeit zu erleichtern.

Sie können die Automatisierungdb-rg-Ressourcengruppe bereitstellen, um Ihren Metadatenspeicher zu hosten.

Wichtig

Keine dieser Automatisierungsdienste sind Produkte, und sie veranschaulichen keine Roadmap-Elemente. Sie werden aufgeführt, um Ihnen dabei zu helfen, welche Elemente Sie möglicherweise automatisieren möchten.

Dienste

Dienst Dienstbereich
Bereitstellung der Datenzielzone Dieser Dienst erstellt eine neue Datenzielzone. Es ist unwahrscheinlich, dass es häufig verwendet wird, aber für die Vollständigkeit der End-to-End-Onboarding-Lösung enthalten ist. Weitere Informationen finden Sie unter Bereitstellung der Cloud-Skalierungsanalyse
Datenprodukt-Onboarding Dieser Dienst erstellt und ändert Ressourcengruppen, die sich auf einen integrierten Mandanten beziehen. Es enthält auch Funktionen zum Aktualisieren und Reduzieren von SKUs und zum Aktivieren und Deaktivieren von Ressourcengruppen für jeden integrierten Mandanten oder Dienst. Es erstellt eine neue Datenzielzone DevOps. Weitere Informationen finden Sie unter Bereitstellung der Cloud-Skalierungsanalyse
Zugriffsbereitstellung Dieser Dienst erstellt Zugriffspakete, Zugriffsrichtlinien und einen Genehmigungsprozess für den Ressourcenzugriff (manuell oder automatisch) mithilfe von SPN/UPN. Es kann auch eine API verfügbar machen, um eine Liste der Abonnementanforderungen (Assets) bereitzustellen, die Benutzer in den letzten 90 Tagen übermittelt haben. Weitere Informationen finden Sie unter Datenzugriffsverwaltung
Datenagnostische Aufnahme Dieser Microservice erstellt neue Datenquellen für die Aufnahme in Ihre Datenzielzonen. Dies geschieht durch Kommunikation mit einem Azure Data Factory SQL-Datenbank Metastore in jeder Datenzielzone. Weitere Informationen finden Sie unter Unterstützung der Analysen auf Cloudebene in Azure durch Frameworks zur automatisierten Erfassung
Metadaten Dieser Dienst hat Metadaten für die Plattform verfügbar gemacht und erstellt. Weitere Informationen finden Sie unter Metadatenstandards
Datenlebenszyklus: Dieser Dienst ist verantwortlich für die Wartung des Datenlebenszyklus basierend auf Metadaten. Diese Wartung kann das Verschieben von Daten in den Cold Storage und das Löschen von Datensätzen umfassen, die nicht mehr aufbewahrt werden müssen. Weitere Informationen finden Sie unter Lebenszyklusverwaltung
Onboarding von Datendomänen GILT NUR FÜR DATA MESH. Dieser Dienst erfasst Metadaten im Zusammenhang mit neuen Domänen und integriert die neuen Domänen nach Bedarf. Er kann auch alle Domänen- oder Dienstzeilen erstellen, aktualisieren, aktivieren und deaktivieren, die Sie möglicherweise in einen Microservice erstellen. Weitere Informationen finden Sie unter Bereitstellung der Cloud-Skalierungsanalyse

Datenstandardisierung

Obwohl es sich nicht um ein bestimmtes Feature oder Produkt Ihrer Zielzone für die Datenverwaltung handelt, sollten Sie die Datenstandardisierung in allen Diensten aufrufen. Die Datenstandardisierung definiert das Format, in dem Ihre Daten landen und gespeichert werden sollen.

Tipp

Verwenden Sie das Delta-Lake-Format, wenn möglich, als Defacto-Standard für alle Dienste und Speicher.

Weitere Informationen finden Sie unter Datenstandardisierung.

Nächste Schritte