Freigeben über


Datenkatalog

Der Datenkatalog registriert und pflegt die Dateninformationen an einem zentralen Ort und macht sie für die Organisation verfügbar. Dadurch wird sichergestellt, dass Unternehmen doppelte Datenprodukte vermeiden, die durch redundante Datenerfassung durch verschiedene Projektteams verursacht werden. Es wird empfohlen, einen Datenkatalogdienst zu erstellen, um die Metadaten der Datenprodukte zu definieren, die in den Datenzielzonen gespeichert sind.

Cloud-Skalierungsanalysen sind von Microsoft Purview abhängig, um Unternehmensdatenquellen zu registrieren, sie zu klassifizieren, die Datenqualität sicherzustellen und einen sicheren Self-Service-Zugriff zu bieten.

Microsoft Purview ist ein Dienst auf Mandantenebene und kann mit jeder Datenzielzone kommunizieren, indem ein verwaltetes virtuelles Netzwerk erstellt wird, das in der Region Ihrer Datenzielzonen bereitgestellt ist. Sie können Azure Managed Virtual Network Integration Runtimes (IR) in Microsoft Purview Managed Virtual Networks in jeder verfügbaren Microsoft Purview-Region bereitstellen. Von dort aus kann die verwaltete IR des virtuellen Netzwerks private Endpunkte verwenden, um eine sichere Verbindung mit den unterstützten Datenquellen herzustellen und diese zu überprüfen. Weitere Informationen finden Sie unter Verwenden des verwalteten virtuellen Netzwerks mit Ihrem Microsoft Purview-Konto. Durch das Erstellen einer IR in einem verwaltetem virtuellen Netzwerk wird sichergestellt, dass der Datenintegrationsprozess isoliert und sicher ist.

Bei Verwendung von Azure Databricks empfehlen wir zusätzlich zu Microsoft Purview Azure Databricks Unity Catalog zu verwenden. Azure Databricks Unity Catalog bietet zentrale Zugriffssteuerung, Überwachung, Herkunftsnachverfolgung und Funktionen zur Datenerkennung in Databricks-Arbeitsbereichen. Bewährte Methoden zum Einrichten von Unity Catalog finden Sie unter Bewährte Methoden für Unity Catalog.

Hinweis

Obwohl sich diese Dokumentation in erster Linie auf die Verwendung von Microsoft Purview für die Governance konzentriert, haben Unternehmen möglicherweise in andere Produkte investiert, z. B. Alation, Okera oder Collibra. Diese Lösungen basieren auf einem Abonnement, und wir empfehlen, sie in der Landing Zone für das Datenmanagement zu implementieren. Beachten Sie, dass möglicherweise organisationsspezifische Integrationsmaßnahmen erforderlich sind.

Datenermittlung

Die Datenermittlung spiegelt den Zustand aller Daten wider, die sich im Besitz des Unternehmens befinden. Diese Daten werden als Datenbestand bezeichnet. Während der Datenermittlung wird der Datenbestand gescannt und klassifiziert. Der Datenscanvorgang stellt eine direkte Verbindung mit der Datenquelle gemäß einem festgelegten Zeitplan bereit.

Wenn Sie der Umgebung eine neue Datenzielzone hinzufügen, werden die zugeordneten Data Lakes und Quellen der mehrsprachigen Persistenz als von Datenkatalog-Crawlern zu scannende Quellen registriert.

Mit der automatisierten Ermittlung Ihres Datenbestands zum Auffüllen des Katalogs können Sie:

  • Metadaten aus Azure- und lokalen Datenquellen durchforsten
  • Ihre Data Lakes, Blobs und andere unterstützte Ziele scannen
  • Extrahieren von Schemata aus Ihren Datenzielen für die Dateitypen XML, TSV, CSV, PSV, SSV, JSON, Parquet, Avro und ORC
  • Automatische Katalogaktualisierungen durch konfigurierbare Planung von Scans und Scan-Regelsätzen ermöglichen

Wichtig

Wenn Sie der Umgebung eine neue Datenzielzone hinzufügen, registrieren Sie die zugehörigen Data Lakes und den polyglotten Speicher über Azure DevOps als Quelle, damit die Datenkatalog-Crawler Daten scannen, steuern und die Datenintegrität verwalten.

Datenklassifizierung

Mit Microsoft Purview können Sie systemseitige oder benutzerdefinierte Klassifizierungen auf Datei-, Tabellen- oder Spaltenressourcen anwenden.

Datenklassifizierungen ähneln ähneln Schlagwörtern. Microsoft Purview markiert und identifiziert den Inhalt bestimmter Datentypen, die während des Scannens in Ihrem Datenbestand gefunden wurden. Vertraulichkeitsbezeichnungen werden verwendet, um die Klassifizierungstypkategorien in Ihren Organisationsdaten zu ermitteln. Sie können auch Vertraulichkeitsbezeichnungen verwenden, um die Richtlinien zu gruppieren, die Sie auf jede Kategorie anwenden möchten. Microsoft Purview verwendet dieselben vertraulichen Informationstypen wie Microsoft 365, sodass Sie Ihre vorhandenen Sicherheitsrichtlinien und -schutzmaßnahmen auf Ihren gesamten Inhalt und ihre gesamte Datenmenge erweitern können.

Microsoft Purview kann Dokumente automatisch scannen und klassifizieren. Wenn Sie beispielsweise über eine Datei mit dem Namen multiple.docx verfügen, die eine Personalausweisnummer für ein Land enthält, fügt Microsoft Purview auf der Seite mit den Ressourcendetails eine Klassifizierung wie EU National Identification Number hinzu.

Microsoft Defender for SQL ist ein für Azure SQL-Datenbank, Azure SQL Managed Instance und Azure Synapse Analytics verfügbares Feature. Dazu zählen die Funktionen zur Ermittlung und Klassifizierung sensibler Daten, Ermittlung und Verringerung potenzieller Datenbankschwachstellen und Erkennung ungewöhnlicher Aktivitäten, die eine Bedrohung für Ihre Datenbank darstellen können. Microsoft Defender für SQL bietet eine einzige Anlaufstelle zum Aktivieren und Verwalten dieser Funktionen.

Nächste Schritte