Delen via


Gegevens verkennen

Azure Databricks biedt een reeks hulpprogramma's en producten die de detectie van gegevensassets vereenvoudigen die toegankelijk zijn via het Databricks Data Intelligence Platform. Dit artikel bevat een aanbevolen overzicht van hoe u gegevens kunt detecteren en bekijken die al zijn geconfigureerd voor toegang in uw werkruimte.

Onderwerpen in deze sectie zijn gericht op het verkennen van gegevensobjecten en gegevensbestanden. Als u informatie zoekt over het werken met assets zoals notebooks, SQL-query's, bibliotheken en modellen, raadpleegt u Navigeren in de werkruimte.

Als u hulp zoekt bij het genereren van samenvattingsstatistieken voor gegevenssets of andere taken die zijn gekoppeld aan verkennende gegevensanalyse (EDA), raadpleegt u Verkennende gegevensanalyse in Azure Databricks: Hulpprogramma's en technieken.

Hoe kunt u gegevensassets detecteren?

Hulpprogramma's voor gegevensdetectie in Azure Databricks vallen in de volgende algemene categorieën:

  • Ai-ondersteunde inzichten, samenvatting en zoekopdrachten.
  • Trefwoorden zoeken.
  • Catalogusverkenning met behulp van de gebruikersinterface.
  • Programmatisch weergeven en metagegevens verkennen.

Hulpprogramma's voor gegevensdetectie zijn geoptimaliseerd voor gegevens die worden beheerd door Unity Catalog. Gegevensassets die niet zijn geregistreerd als Unity Catalog-objecten, kunnen mogelijk niet worden gedetecteerd met behulp van een aantal van deze methoden.

Gegevens zoeken met behulp van de gebruikersinterface

Catalog Explorer biedt hulpprogramma's voor het verkennen en beheren van gegevensassets. U opent Catalog Explorer met behulp van de Cataloguspictogram catalogus in de zijbalk van de werkruimte. Zie Wat is Catalog Explorer?

Notebooks en de SQL-queryeditor bieden ook een catalogusnavigator voor het verkennen van databaseobjecten. Klik op het cataloguspictogram in deze interfaces om de catalogusnavigator uit te vouwen of samen te vouwen zonder de code-editor te verlaten.

Zodra u een interessante gegevensset hebt ontdekt, kunt u het tabblad Inzichten gebruiken om te leren hoe de gegevens worden gebruikt in uw werkruimte. Zie Frequente query's en gebruikers van een tabel weergeven.

Gegevens programmatisch verkennen

U kunt de SHOW opdracht op alle databaseobjecten gebruiken om assets te detecteren die zijn geregistreerd bij Unity Catalog. Gebruik de LIST opdracht, de %fs magic-opdracht of Databricks Utilities om bestanden weer te geven.

Zie Opslag verkennen en gegevensbestanden zoeken en Databaseobjecten verkennen.

Gegevensopmerkingen controleren

U kunt opmerkingen bekijken voor meer informatie over de inhoud van gegevenssets die beschikbaar zijn in uw Lakehouse. Opmerkingen kunnen worden ingesteld voor gegevensobjecten, waaronder catalogi, schema's, tabellen en kolommen. U kunt opmerkingen weergeven in Catalog Explorer of de DESCRIBE opdracht voor een object gebruiken.

Catalog Explorer kan door AI gegenereerde opmerkingen bieden voor tabellen, waardoor eigenaren van gegevensassets eenvoudig een uitgebreid overzicht van gegevenssets kunnen bieden. Zie Door AI gegenereerde opmerkingen toevoegen aan Unity Catalog-objecten.

Gebruikers kunnen eventueel ook opmerkingen geven over tabellen en andere databaseobjecten met behulp van Markdown, die wordt weergegeven in Catalog Explorer. Zie Opmerkingen toevoegen aan gegevens en AI-assets.

Zoeken naar tabellen in uw lakehouse

U kunt de zoekbalk in Azure Databricks gebruiken om tabellen te vinden die zijn geregistreerd bij Unity Catalog. U kunt een trefwoordzoekopdracht uitvoeren of semantische zoekopdrachten gebruiken om gegevenssets of kolommen te vinden die betrekking hebben op uw zoekquery. Zoeken retourneert alleen resultaten voor tabellen die u mag zien. Zoeken controleert tabelnamen, kolomnamen, tabelopmerkingen en kolomopmerkingen. Zie Zoeken naar werkruimteobjecten.