Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Azure Databricks bietet eine Reihe von Tools und Produkten, die die Ermittlung von Datenressourcen vereinfachen, die über Databricks Data Intelligence Platform zugänglich sind. Dieser Artikel bietet eine fundierte Übersicht darüber, wie Sie Daten ermitteln und in der Vorschau anzeigen können, die bereits für den Zugriff in Ihrem Arbeitsbereich konfiguriert wurden.
- Informationen zum Herstellen einer Verbindung mit Datenquellen finden Sie unter Herstellen einer Verbindung mit Datenquellen und externen Diensten.
- Informationen zum Zugriff auf Daten im Databricks Marketplace finden Sie unter Was ist Databricks Marketplace?.
Die Themen in diesem Abschnitt konzentrieren sich auf das Untersuchen von Datenobjekten und Datendateien. Wenn Sie nach Informationen zum Arbeiten mit Objekten wie Notizbüchern, SQL-Abfragen, Bibliotheken und Modellen suchen, lesen Sie die Arbeitsbereichsbenutzeroberfläche.
Wenn Sie Anleitungen zum Generieren von Zusammenfassungsstatistiken für Datasets oder andere Aufgaben im Zusammenhang mit explorativer Datenanalyse (EDA) suchen, lesen Sie explorative Datenanalyse zu Azure Databricks: Tools und Techniken.
Wie können Sie Datenressourcen ermitteln?
Die Datenermittlungstools in Azure Databricks sind in die folgenden allgemeinen Kategorien unterteilt:
- KI-gestützte Erkenntnisse, Zusammenfassung und Suche
- Schlüsselwortsuche
- Katalogerkundung mithilfe der Benutzeroberfläche
- Programmgesteuerte Auflistung und Metadatenerkundung
Datenermittlungstools sind für Daten optimiert, die durch Unity Catalog gesteuert werden. Datenressourcen, die nicht als Unity Catalog-Objekte registriert wurden, können mit einigen dieser Ansätze möglicherweise nicht gefunden werden.
Suchen von Daten mithilfe der Benutzeroberfläche
- Genie: Durchsuchen Sie mit Ihnen geteilte Ressourcen, suchen Sie nach Namen, stellen Sie Datenfragen in natürlicher Sprache und filtern Sie nach Domäne. Siehe Verwenden der Genie-Schnittstelle.
- Seite "Entdecken": Eine kuratierte Browserumgebung, mit der Sie Datenressourcen nach Domänen organisieren können. Kuratoren können wichtige Ressourcen für ihre Organisation hervorheben, und Verbraucher können nach Domäne oder Objekttyp suchen. Siehe "Seite entdecken", "Domänen" und "Unterdomänen".
-
Katalog-Explorer: Stellt Tools zum Untersuchen und Verwalten von Datenressourcen bereit. Greifen Sie über
Katalog in der Seitenleiste des Arbeitsbereichs auf Catalog Explorer zu. Verwenden Sie die Registerkarte "Insights ", um zu erfahren, wie Daten in Ihrem Arbeitsbereich verwendet werden. Siehe Was ist der Katalog-Explorer? und Häufige Abfragen und Benutzer einer Tabelle anzeigen.
- Notizbücher und SQL-Editor: Stellen Sie außerdem einen Katalognavigator zum Untersuchen von Datenbankobjekten bereit. Klicken Sie auf das Katalogsymbol in der Editor-Randleiste, um den Katalognavigator zu erweitern oder zu reduzieren, ohne den Code-Editor zu verlassen.
Programmgesteuertes Untersuchen von Daten
Sie können den Befehl SHOW für alle Datenbankobjekte verwenden, um Ressourcen zu ermitteln, die in Unity Catalog registriert sind. Verwenden Sie den Befehl LIST, den Magic-Befehl %fs oder Databricks-Hilfsprogramme, um Dateien aufzulisten.
Weitere Informationen finden Sie unter Speicher durchsuchen und Datendateien finden und Untersuchen von Datenbankobjekten.
Überprüfen von Datenkommentaren
Sie können Kommentare überprüfen, um mehr über die Inhalte von Datasets zu erfahren, die in Ihrem Lakehouse verfügbar sind. Kommentare können für Datenobjekte festgelegt werden, einschließlich Katalogen, Schemas, Tabellen und Spalten. Sie können Kommentare im Katalog-Explorer anzeigen oder den Befehl DESCRIBE für ein Objekt verwenden.
Der Katalog-Explorer kann KI-generierte Kommentare für Tabellen bereitstellen. So können Besitzer*innen von Datenressourcen eine umfassende Übersicht über Datasets bereitstellen. Siehe Hinzufügen von KI-generierten Kommentaren zu Unity Catalog-Objekten.
Benutzer*innen können optional auch Kommentare zu Tabellen und anderen Datenbankobjekten mithilfe von Markdown bereitstellen. Dies wird dann im Katalog-Explorer gerendert. Weitere Informationen finden Sie unter Hinzufügen von Kommentaren zu Daten und KI-Ressourcen.
Nach Tabellen in Ihrem Lakehouse suchen
Sie können die Suchleiste in Azure Databricks verwenden, um in Unity Catalog registrierte Tabellen zu finden. Sie können entweder eine Schlüsselwortsuche ausführen oder die semantische Suche verwenden, um Datasets oder Spalten im Zusammenhang mit Ihrer Suchabfrage zu finden. Die Suche gibt nur Ergebnisse für Tabellen zurück, zu deren Anzeige Sie berechtigt sind. Bei der Suche werden Tabellennamen, Spaltennamen, Tabellenkommentare und Spaltenkommentare überprüft. Weitere Informationen finden Sie unter Suchen nach Arbeitsbereichsobjekten.