Überwachen der Datenzuordnungsauffüllung in Microsoft Purview

In Microsoft Purview können Sie verschiedene Arten von Datenquellen überprüfen und die überprüfungs-status im Laufe der Zeit anzeigen. Sie können auch andere Dienste mit Microsoft Purview verbinden und die Trends der erfassten Ressourcen/Beziehung anzeigen. In diesem Artikel wird beschrieben, wie Sie die Datenzuordnungspopulation aus der Vogelperspektive überwachen und erhalten.

Überwachen von Scanausführungen

  1. Öffnen Sie das Microsoft Purview-Governanceportal wie folgt:

  2. Öffnen Sie Ihr Microsoft Purview-Konto, und wählen Sie Data map ->Überwachung aus. Sie müssen über die Rolle Datenquellenadministrator für jede Sammlung verfügen, um auf diese Seite zugreifen zu können. Außerdem werden die Überprüfungsausführungen angezeigt, die zu den Sammlungen gehören, für die Sie über Datenquellenadministratorrechte verfügen.

  3. Die allgemeinen KPIs zeigen die Gesamtanzahl der Scanausführungen innerhalb eines Zeitraums an. Der Zeitraum ist standardmäßig auf die letzten 30 Tage festgelegt. Sie können auch die letzten sieben Tage auswählen. Basierend auf dem ausgewählten Zeitfilter können Sie die Verteilung der erfolgreichen, fehlgeschlagenen, abgebrochenen und in Bearbeitung ausgeführten Scanausführungen nach Woche oder Tag im Diagramm anzeigen.

    Anzeigen von Scanausführungen im Zeitverlauf

  4. Am unteren Rand des Diagramms finden Sie einen Link Mehr anzeigen , den Sie genauer untersuchen können. Über den Link wird die Seite scan status geöffnet. Hier sehen Sie einen Scannamen und die Häufigkeit, mit der die Überprüfung im Zeitraum erfolgreich war, fehlgeschlagen oder abgebrochen wurde. Sie können die Liste auch nach Quelltypen filtern.

    Anzeigen von Status in Details

  5. Sie können eine bestimmte Überprüfung weiter untersuchen, indem Sie den Scannamen auswählen. Sie werden mit der Seite "Scanverlauf" verbunden, auf der Sie die Liste der Ausführungs-IDs mit weiteren Ausführungsdetails finden.

    Anzeigen des Scanverlaufs für eine bestimmte Überprüfung

  6. Sie können in die Ausführungs-ID klicken, um mehr über die Details der Überprüfungsausführung zu überprüfen.

Bekannte Einschränkungen:

Derzeit enthält diese Überwachungsumgebung nicht die folgenden Informationen. Sie können die details der entsprechenden Überprüfungsausführung überprüfen.

  • Die status und Dauer umfassen nur die Überprüfungsphase (Ermittlung von der Quelle), aber nicht die Erfassungsphase. Möglicherweise wird eine Diskrepanz im Vergleich zum Detailbereich der Scanausführung angezeigt.
  • Überprüfungsausführungen der Herkunftsextraktion für Azure SQL-Datenbank werden nicht behandelt.
  • Bei Überprüfungen von Azure Synapse Analytics-Arbeitsbereich, Azure-Abonnement/-Ressourcengruppe und AWS-Konto werden nur die status/Anzahl untergeordneter Überprüfungsausführungen pro Ressource erfasst.

Details zur Überprüfungsausführung

Sie können von verschiedenen Orten aus zum Scanausführungsverlauf für eine bestimmte Überprüfung navigieren:

  • Navigieren Sie wie im Abschnitt Überwachen von Scanausführungen beschrieben zu Data Map ->Überwachung.
  • Wechseln Sie zu Data Map ->Quellen –> wählen Sie die gewünschte Datenquelle aus.> Weitere Informationen finden Sie unter Scans, Zuletzt durchgeführte Überprüfungen oder Zuletzt fehlgeschlagene Überprüfungen.
  • Wechseln Sie zu Data Map ->Sammlungen -> wählen Sie die gewünschte Sammlung ->Scans -> wählen Sie den Scannamen aus, den Sie mehr anzeigen möchten.

Die Aufbewahrungsdauer des Scanausführungsverlaufs beträgt 90 Tage.

Sie können auf die Ausführungs-ID klicken, um mehr über die Details der Überprüfungsausführung zu überprüfen:

Screenshot: Anzeigen von Details zur Ausführung der Scanausführung

  • Ausführungs-ID: Die GUID, die verwendet wird, um die angegebene Überprüfungsausführung zu identifizieren.

  • Ausführungstyp: Vollständige oder inkrementelle Überprüfung.

  • Im Abschnitt "Überprüfung" werden die Metriken für die Ermittlungsphase zusammengefasst, die Purview mit der Quelle verbindet, die Metadaten/Herkunft extrahiert und die Daten klassifiziert.

    • Status scannen:

      Status Beschreibung
      Abgeschlossen Die Überprüfungsphase ist erfolgreich.
      Fehlgeschlagen Die Überprüfungsphase schlägt fehl. Sie können die Fehlerdetails überprüfen, indem Sie daneben auf den Link "Weitere Informationen" klicken.
      Abgebrochen Die Überprüfungsausführung wird vom Benutzer abgebrochen.
      In Bearbeitung Die Überprüfung wird ausgeführt.
      In Warteschlange eingereiht Die Überprüfungsausführung wartet auf die verfügbare Integration Runtime-Ressource.
      Wenn Sie eine selbstgehostete Integration Runtime verwenden, beachten Sie, dass jeder Knoten abhängig von Ihrer Computerspezifikation (CPU und Arbeitsspeicher) mehrere gleichzeitige Überprüfungen gleichzeitig ausführen kann. Weitere Überprüfungen befinden sich in der status in der Warteschlange.
      Gedrosselt Die Überprüfungsausführung wird gedrosselt. Dies bedeutet, dass dieses Microsoft Purview-Konto derzeit mehr laufende Überprüfungsausführungen aufweist als die zulässige maximale gleichzeitige Anzahl. Weitere Informationen zum Grenzwert finden Sie hier. Diese bestimmte Überprüfungsausführung wartet und wird ausgeführt, sobald Ihre anderen laufenden Überprüfungen abgeschlossen sind.

      Die Überprüfungsausführung wird während der status "Gedrosselt" oder "In die Warteschlange eingereiht" nicht berechnet.

    • Scantyp: Manuelle oder geplante Überprüfung.

    • Ermittelte Ressourcen: Die Anzahl der ressourcen, die aus der Quelle aufgezählt wurden. Sowohl für vollständige als auch für inkrementelle Überprüfungen werden alle Ressourcen im konfigurierten Bereich eingeschlossen, unabhängig davon, ob es sich um vorhandene oder neu erstellte/aktualisierte Ressourcen seit der letzten Überprüfung handelt. Während für die inkrementelle Überprüfung werden detaillierte Metadaten nur für neu erstellte oder aktualisierte Ressourcen zusätzlich extrahiert.

    • Klassifizierte Ressourcen: Die Anzahl der Ressourcen, die zur Klassifizierung der Daten in die Stichprobe einbezogen wurden, unabhängig davon, ob die Ressourcen eine übereinstimmende Klassifizierung aufweisen oder nicht. Es handelt sich um eine Teilmenge der ermittelten Ressourcen, die auf dem Samplingmechanismus basieren. Für die inkrementelle Überprüfung können nur neu erstellte oder aktualisierte Ressourcen für die Klassifizierung ausgewählt werden.

    • Dauer: Die Dauer der Überprüfungsphase und die Start-/Endzeit.

  • Der Abschnitt "Datenerfassung" fasst die Metriken für die Erfassungsphase zusammen, in der Purview die Data Map mit den identifizierten Metadaten und der beziehungsweisen Auffüllt.

    • Erfassungs-status:

      Status Beschreibung
      Abgeschlossen Alle Ressourcen und Beziehungen werden erfolgreich in der Data Map erfasst.
      Abgeschlossen mit Ausnahmen (vorheriges "Teilweise abgeschlossen") Ein Teil der Ressourcen und Beziehungen wird erfolgreich in der Datenzuordnung erfasst, während einige fehlschlagen.
      Fehlgeschlagen Die Erfassungsphase schlägt fehl.
      Abgebrochen Die Überprüfungsausführung wird vom Benutzer abgebrochen, sodass die Erfassung abgebrochen wird.
      In Bearbeitung Die Erfassung wird ausgeführt.
      In Warteschlange eingereiht Die Erfassung wartet auf die verfügbare Dienstressource oder auf die Überprüfung, um Metadaten zu ermitteln.
    • Erfasste Ressourcen: Die Anzahl der in der Datenzuordnung erfassten Ressourcen. Für die inkrementelle Überprüfung enthält sie nur die neu erstellten oder aktualisierten Ressourcen. In diesem Fall kann es sein, dass die Anzahl der ermittelten Objekte kleiner ist als die Anzahl der ermittelten Objekte. Beim Überprüfen einer dateibasierten Quelle ist dies die Anzahl der rohen Ressourcen vor der Aggregation von Ressourcengruppen.

    • Erfasste Beziehungen: Die Anzahl der in der Datenzuordnung erfassten Beziehungen. Sie umfasst die Herkunft und andere Beziehungen wie Fremdschlüsselbeziehungen.

    • Dauer: Die Erfassungsdauer und die Start-/Endzeit.

Anzeigen des Ausnahmeprotokolls (Vorschau)

Wenn einige Ressourcen oder Beziehungen während der Überprüfung nicht in data map erfasst werden können, z. B. die Erfassung status mit Ausnahmen als abgeschlossen endet, wird im Detailbereich der Scanausführung die Schaltfläche "Protokoll herunterladen" angezeigt. Es stellt Ausnahmeprotokolldateien bereit, die die Details der Fehler erfassen.

Die folgende Tabelle zeigt das Schema einer Protokolldatei.

Spalte Beschreibung
TimeStamp Der UTC-Zeitstempel, wenn der Erfassungsvorgang erfolgt.
ErrorCode Fehlercode der Ausnahme.
OperationItem Bezeichner für das fehlerhafte Objekt/die fehlerhafte Beziehung, in der Regel mit dem vollqualifizierten Namen.
Nachricht Weitere Informationen dazu, welche Ressource/Beziehung aus welchem Grund nicht erfasst werden konnte. Wenn es einen Erfassungsfehler für die Ressourcengruppe gibt, kann dies auf mehrere Ressourcen angewendet werden, die demselben Benennungsmuster entsprechen, und die Meldung enthält die betroffene Anzahl.

Derzeit enthält das Ausnahmeprotokoll keine Fehler, die während der Überprüfungsphase (Metadatenermittlung) aufgetreten sind. Sie wird später hinzugefügt.

Sie können andere Dienste mit Microsoft Purview verbinden, um einen "Link" herzustellen, der die Metadaten und die Herkunft der Ressourcen dieses Diensts für Microsoft Purview zur Verfügung stellt. Derzeit wird Link für Azure Data Factory und Azure Synapse Analytics unterstützt.

So überwachen Sie die über die Links erfassten Ressourcen und Beziehungen:

  1. Wechseln Sie zu Ihrem Microsoft Purview-Konto.> Öffnen Sie das Microsoft Purview-Governanceportal Data>map ->Monitoring ->Links. Sie müssen über die Rolle Datenquellenadministrator für jede Sammlung verfügen, um auf die Registerkarte Überwachung zugreifen zu können. Außerdem werden die Ergebnisse angezeigt, die zu den Sammlungen gehören, für die Sie über Datenquellenadministratorrechte verfügen. Die Berechtigung für die Stammsammlung ist erforderlich, um Azure Data Factory und Azure Synapse Analytics-Links zu überwachen.

  2. Sie können die allgemeinen KPIs anzeigen, einschließlich der Gesamtzahl der Quellen, der Anzahl der erfassten Ressourcen und der Beziehung (Herkunft), gefolgt von Trenddiagrammen im Laufe der Zeit. Sie können zusätzliche Filter auf die folgenden Anwenden, um die Ergebnisse einzugrenzen:

    • Quelltyp
    • Quellname
    • Datumsbereich: Der Standardwert ist 30 Tage. Sie können auch die letzten sieben Tage oder einen benutzerdefinierten Datumsbereich auswählen. Die Aufbewahrungsdauer beträgt 45 Tage.

    Die Metriken werden bis zu dem Datum gemeldet, das in der oberen rechten Ecke angezeigt wird. Die Aggregation erfolgt stündlich.

    Screenshot: Anzeigen von Linkergebnissen

  3. Am unteren Rand des Diagramms finden Sie einen Link Mehr anzeigen , den Sie genauer untersuchen können. Auf der Seite Link status können Sie eine Liste der Quellnamen zusammen mit dem Quelltyp, den erfassten Ressourcen, der erfassten Beziehung und der letzten Laufzeitzeit anzeigen. Die Filter auf der vorherigen Seite werden übernommen, und Sie können die Liste nach Quelltyp, Quellname und Datumsbereich weiter filtern.

    Screenshot: Anzeigen der Linkergebnisse nach Quelle.

  4. Sie können einen Drilldown zu jeder Quelle ausführen, um die Details der nächsten Ebene anzuzeigen, indem Sie auf den Quellnamen klicken. Für Azure Data Factory wird beispielsweise gezeigt, wie jede Pipelineaktivität die Ressourcen und die Beziehung zu Microsoft Purview mit dem Namen im Format meldet<pipeline_name>/<activity_name>.

    Screenshot: Anzeigen von Linkergebnissen nach untergeordneten Artefakten der Quelle.

Bekannte Einschränkungen

  • Für Azure Data Factory und Azure Synapse Analytics erfasst diese Linküberwachung derzeit die Ressourcen und Beziehungen, die aus der Kopieraktivität generiert wurden, aber nicht den Datenfluss und SSIS-Aktivitäten.
  • Die Aggregation und der Datumsfilter liegen in UTC-Zeit vor.

Scans werden nicht mehr ausgeführt

Wenn Ihre Microsoft Purview-Überprüfung früher erfolgreich ausgeführt wurde, aber jetzt fehlschlägt, überprüfen Sie folgendes:

  1. Überprüfen Sie zuerst die Fehlermeldung, um die Fehlerdetails anzuzeigen.
  2. Wurden die Anmeldeinformationen für Ihre Ressource geändert oder rotiert? Wenn dies der Fall ist, müssen Sie aktualisieren, damit Ihre Überprüfung die richtigen Anmeldeinformationen verwendet.
  3. Verhindert ein Azure PolicyUpdates für Speicherkonten? Wenn ja, befolgen Sie die Anleitung zu Microsoft Purview-Ausnahmetags , um eine Ausnahme für Microsoft Purview-Konten zu erstellen.
  4. Verwenden Sie eine selbstgehostete Integration Runtime? Überprüfen Sie, ob sie mit der neuesten Software auf dem neuesten Stand ist und mit Ihrem Netzwerk verbunden ist.

Nächste Schritte