Teilen über


Häufig gestellte Fragen zu Azure Data Catalog

Wichtig

Der Azure-Datenkatalog wurde am 15. Mai 2024 eingestellt.

Verwenden Sie zur Nutzung von Data Catalog-Features den Dienst Microsoft Purview, der einheitliche Data Governance für Ihren gesamten Datenbestand bietet.

Dieser Artikel bietet Antworten auf häufig gestellte Fragen im Zusammenhang mit dem Azure Data Catalog-Dienst.

Was ist Azure Data Catalog?

Azure Data Catalog ist ein vollständig verwalteter in Microsoft Azure gehosteter Dienst, der als Registrierungs- und Ermittlungssystem für Datenquellen von Unternehmen dient. Data Catalog ermöglicht Benutzern – von Analysten über Data Scientists bis hin zu Entwicklern –, Datenquellen zu registrieren, zu ermitteln, zu verstehen und zu nutzen.

Welche Kundenprobleme werden gelöst?

Mit Data Catalog werden Probleme bei der Ermittlung von Datenquellen und „obskuren Daten“ gelöst, indem Benutzer Datenquellen von Unternehmen ermitteln und verstehen können.

Was sind die Zielgruppen?

Data Catalog ist für technische und nicht technische Benutzer gedacht, z.B.:

  • Datenentwickler, BI- und Analyseexperten: Mitarbeiter, die für die Produktion von Daten- und Analyseinhalten zuständig sind, die von anderen Benutzern verwendet werden.
  • Data Stewards: Mitarbeiter, die über die Kenntnisse zu den Daten verfügen, ihre Bedeutung kennen und über die beabsichtigte Nutzung Bescheid wissen.
  • Datennutzer: Mitarbeiter, die Daten leicht ermitteln und verstehen und Verbindungen damit herstellen müssen, um ihre Aufgaben mit dem Tool ihrer Wahl zu erledigen.
  • Zentrale IT-Abteilung: Mitarbeite, die Hunderte von Datenquellen für die Ermittlung durch Sachbearbeiter bereitstellen und überwachen müssen, wie und von wem Daten verwendet werden.

Wie lange ist Data Catalog verfügbar?

Data Catalog ist bis August 2025 verfügbar. Sie müssen bis zu diesem Zeitpunkt eine Migration durchführen.

Zu welcher Lösung können wir migrieren?

Sie können zum Microsoft Purview-Dienst migrieren, der einheitliche Datengovernance für Ihren gesamten Datenbestand bietet.

Wie ist die Verfügbarkeit nach Region?

Data Catalog-Dienste sind derzeit in den folgenden Rechenzentren verfügbar:

  • USA (Westen)
  • East US
  • Europa, Westen
  • Nordeuropa
  • Australien (Osten)
  • Asien, Südosten

Welche Grenzwerte gelten für die Anzahl der Datenobjekte?

Die Free Edition von Data Catalog ist auf 5.000 registrierte Datenobjekte begrenzt.

Die Standard Edition von Data Catalog unterstützt bis zu 100.000 registrierte Datenobjekte.

Jedes in Data Catalog registrierte Objekt, z.B. Tabellen, Ansichten, Dateien und Berichte, zählen als Datenobjekt.

Welche Datenquellen und -objekttypen werden unterstützt?

Eine Liste mit den derzeit unterstützten Datenquellen finden Sie in der Liste der unterstützten Datenquellen.

Wie fordere ich die Unterstützung für eine andere Datenquelle an?

Zum Übermitteln von Anfragen zu Features und anderem Feedback können Sie die Azure-Foren für Feedback zu Data Catalog verwenden.

Warum erhalte ich den Fehler „Katalog bereits vorhanden“, wenn ich versuche, einen neuen Katalog zu erstellen?

Wenn Sie Office 365 E5 mit Power BI Pro Lizenz erwerben, erstellt Microsoft automatisch einen Standardkatalog in der Region des Abonnements. Dieser Katalog verwendet die kostenlose SKU. Die Office 365-/Power BI-Benutzerlizenz wird auf der Verwaltungsseite verwaltet.

Dieser Datenkatalogtyp verfügt jedoch nicht über eine Administratoroption und ist im Azure-Portal nicht sichtbar. Dieser Datenkatalogtyp kann nicht gelöscht werden. Ebenso ist es nicht zulässig, den Datenkatalog umzubenennen, und Sie können ihn nicht in eine andere Region verschieben.

Benutzerkonten, denen automatisch eine Power BI Pro-Lizenz zugewiesen wird, haben per Lizenzvereinbarung Zugriff auf den Datenkatalog, wenn Sie sich für die Office 365 E5 mit Power BI Pro-Lizenz registriert haben. Dieser Benutzertyp hat uneingeschränkten Zugriff auf Datenkatalogobjekte ohne Administratorrechte. Dieser Benutzertyp gehört nicht zu der Katalogbenutzer-Rolle in Azure Data Catalog.

Wie registriere ich meine Daten?

So registrieren Sie Ihre Daten in Data Catalog

  1. Starten Sie im Azure Data Catalog-Portal im Bereich Veröffentlichen das Azure Data Catalog-Registrierungstool.
  2. Melden Sie sich im Data Catalog-Datenquellen-Registrierungstool mit den Anmeldeinformationen an, mit denen Sie auch auf das Data Catalog-Portal zugreifen.
  3. Wählen Sie die Datenquelle und spezifischen Datenobjekte aus, die Sie registrieren möchten.

F: Welche Eigenschaften werden für Datenobjekte extrahiert, die registriert werden?

Die spezifischen Eigenschaften variieren je nach Datenquelle, aber im Allgemeinen werden mit dem Data Catalog-Veröffentlichungsdienst die folgenden Informationen extrahiert:

  • Anlagenname
  • Ressourcentyp
  • Datenobjektbeschreibung
  • Namen von Attributen/Spalten
  • Datentypen von Attributen/Spalten
  • Beschreibung von Attributen/Spalten

Wichtig

Durch das Registrieren von Datenobjekten bei Data Catalog werden Ihre Daten nicht in die Cloud verschoben oder kopiert. Beim Registrieren von Datenobjekten in einer Datenquelle werden die Metadaten des Datenobjekts in Azure kopiert, doch die eigentlichen Daten verbleiben am vorhandenen Speicherort der Datenquelle. Die Ausnahme dieser Regel ist, wenn Sie sich beim Registrieren von Datenobjekten zum Hochladen von Vorschaudatensätzen oder eines Datenprofils entscheiden. Beim Hinzufügen einer Vorschau werden bis zu 20 Datensätze aus jedem Datenobjekt kopiert und als Momentaufnahme in Data Catalog gespeichert. Wenn Sie ein Datenprofil einbeziehen, werden aggregierte Informationen berechnet und den Metadaten hinzugefügt, die im Katalog gespeichert sind. Zu aggregierten Informationen können die Größe von Tabellen, der Prozentsatz der NULL-Werte pro Spalte oder der Mindest-, Höchst- und Durchschnittswert von Spalten gehören.

Hinweis

Für Datenquellen wie SQL Server Analysis Services, die über eine leistungsstarke Description-Eigenschaft verfügen, wird dieser Eigenschaftswert vom Data Catalog-Datenquellen-Registrierungstool extrahiert. Für lokale relationale SQL Server-Datenbanken ohne leistungsstarke Description-Eigenschaft extrahiert das Data Catalog-Datenquellen-Registrierungstool den Wert aus der erweiterten MS_Description-Eigenschaft für Objekte und Spalten. Diese Eigenschaft wird für SQL Azure nicht unterstützt. Weitere Informationen finden Sie unter Verwenden von erweiterten Eigenschaften für Datenbankobjekte.

Wie lange dauert es, bis neu registrierte Datenobjekte in Data Catalog angezeigt werden?

Nach dem Registrieren von Datenobjekten bei Data Catalog kann es 5–10 Sekunden dauern, bevor sie im Data Catalog-Portal angezeigt werden.

Wie kann ich die Metadaten für meine registrierten Datenobjekte mit Anmerkungen versehen und erweitern?

Die einfachste Möglichkeit, Metadaten für registrierte Datenobjekte bereitzustellen, ist das Datenobjekt im Data Catalog-Portal auszuwählen und anschließend die Metadatenwerte im Eigenschaften- oder Schemabereich für das ausgewählte Objekt einzugeben.

Sie können auch während des Registrierungsvorgangs einige Metadaten angeben, z. B. Experten und Tags. Die im Data Catalog-Veröffentlichungsdienst angegebenen Werte gelten für alle Datenobjekte, die zum jeweiligen Zeitpunkt registriert werden. Um die zuletzt registrierten Objekte im Portal anzuzeigen und ihnen weitere Anmerkungen hinzuzufügen, klicken Sie auf dem letzten Bildschirm des Data Catalog-Datenquellen-Registrierungstools auf die Schaltfläche Portal anzeigen.

Wie lösche ich meine registrierten Datenobjekte?

Sie können ein Objekt aus Data Catalog löschen, indem Sie das Objekt im Portal auswählen und dann auf die Schaltfläche Löschen klicken. Beim Entfernen des Objekts werden seine Metadaten aus Data Catalog entfernt. Dieser Vorgang wirkt sich jedoch nicht auf die zugrunde liegende Datenquelle aus.

Was ist ein Experte?

Ein Experte ist eine Person, die über fundiertes Wissen zu einem Datenobjekt verfügt. Ein Objekt kann mehrere Experten haben. Ein Experte muss nicht unbedingt der Besitzer eines Objekts sein. Es handelt sich lediglich um eine Person, die weiß, wie die Daten verwendet werden können und sollten.

Wie stelle ich Informationen für das Data Catalog-Team bereit, wenn Probleme auftreten?

Nutzen Sie das Azure Data Catalog-Forum, um Probleme zu melden, Informationen zu teilen und Fragen zu stellen, oder erstellen Sie eine Supportanfrage.

Funktioniert der Katalog mit einer anderen Datenquelle, die mich interessiert?

Wir arbeiten aktiv daran, Data Catalog weitere Datenquellen hinzuzufügen. Wenn Sie für eine bestimmte Datenquelle Unterstützung wünschen, können Sie diese in den Azure-Foren für Feedback zu Data Catalog vorschlagen (oder eine ggf. bereits vorhandene Anfrage unterstützen).

Welche Berechtigungen benötige ich, um Datenobjekte bei Data Catalog registrieren zu können?

Zum Ausführen des Azure Data Catalog-Registrierungstools benötigen Sie Berechtigungen für die Datenquelle, die Ihnen das Auslesen von Metadaten aus der Quelle ermöglicht. Um auch eine Vorschau hinzuzufügen, müssen Sie über Berechtigungen verfügen, die Ihnen das Einlesen der Daten aus den registrierten Objekten erlauben.

Mit Data Catalog können Katalogadministratoren auch einschränken, welche Benutzer und Gruppen dem Katalog Metadaten hinzufügen können. Weitere Informationen finden Sie unter Schützen des Zugriffs auf Data Catalog und Datenobjekte.

Wird Azure Data Catalog auch für die lokale Bereitstellung verfügbar gemacht?

Data Catalog ist ein Clouddienst, der sowohl Clouddatenquellen als auch lokale Datenquellen verarbeiten kann. Es handelt sich also um eine Hybridlösung zur Ermittlung von Datenquellen. Es ist derzeit keine Version des Data Catalog-Diensts geplant, die lokal ausgeführt wird.

Können aus den von mir registrierten Datenquellen auch mehr oder umfangreichere Metadaten extrahiert werden?

Wir arbeiten derzeit daran, die Funktionen von Data Catalog zu erweitern. Wenn weitere Metadaten während der Registrierung aus der Datenquelle extrahiert werden sollen, können Sie dies in den Azure-Foren für Feedback zu Data Catalog vorschlagen (oder einen bereits vorhandenen Vorschlag unterstützen).

Falls Sie Spalten-/Schemametadaten, Vorschauversionen oder Datenprofile einbinden möchten, können Sie für Datenquellen, bei denen diese Metadaten nicht vom Datenquellen-Registrierungstool extrahiert werden, die Data Catalog-API zum Hinzufügen dieser Metadaten verwenden. Weitere Informationen finden Sie unter Azure Data Catalog-REST-API.

Wie kann ich die Sichtbarkeit der registrierten Datenobjekte so einschränken, dass nur bestimmte Personen sie ermitteln können?

Wählen Sie die Datenobjekte in Data Catalog und dann die Schaltfläche Besitz übernehmen aus. Besitzer von Datenobjekten in Data Catalog können die Einstellungen zur Sichtbarkeit ändern, um entweder für alle Benutzer die Ermittlung der im Besitz befindlichen Ressourcen zuzulassen oder die Sichtbarkeit auf bestimmte Benutzer zu beschränken. Weitere Informationen finden Sie unter Verwalten von Datenobjekten in Azure Data Catalog.

Wie aktualisiere ich die Registrierung für ein Datenobjekt so, dass Änderungen in der Datenquelle im Katalog widergespiegelt werden?

Zum Aktualisieren der Metadaten für Datenobjekte, die im Katalog bereits registriert sind, registrieren Sie die Datenquelle mit den Datenobjekten erneut. Alle Änderungen in der Datenquelle, z.B. hinzugefügte oder entfernte Spalten in Tabellen oder Ansichten, werden im Katalog aktualisiert, aber alle von Benutzern angegebenen Anmerkungen werden beibehalten.

Meine Frage wird hier nicht beantwortet wird. Wo finde ich Antworten?

Besuchen Sie das Azure Data Catalog Q&A-Forum.