Delen via


Tabellen verkennen en maken in DBFS

Belangrijk

Deze documentatie is buiten gebruik gesteld en wordt mogelijk niet bijgewerkt. De producten, services of technologieën die in deze inhoud worden genoemd, worden niet meer ondersteund. Zie Bestanden uploaden naar Azure Databricks, een tabel maken of wijzigen met behulp van het uploaden van bestanden en wat is Catalog Explorer?

Open de gebruikersinterface voor het uploaden en maken van tabellen via de gebruikersinterface voor het toevoegen van gegevens. Klik op Nieuw pictogram New > Data > DBFS.

U kunt de gebruikersinterface ook openen vanuit notitieblokken door te klikken op Gegevens toevoegen van bestand>.

Databricks raadt het gebruik van Catalog Explorer aan voor een verbeterde ervaring voor het weergeven van gegevensobjecten en het beheren van ACL's en het maken of wijzigen van tabellen vanaf de pagina voor het uploaden van bestanden om eenvoudig kleine bestanden op te nemen in Delta Lake.

Notitie

De beschikbaarheid van sommige elementen die in dit artikel worden beschreven, is afhankelijk van werkruimteconfiguraties. Neem contact op met uw werkruimtebeheerder of het azure Databricks-accountteam.

Gegevens importeren

Als u kleine gegevensbestanden op uw lokale computer hebt die u wilt analyseren met Azure Databricks, kunt u ze importeren in DBFS met behulp van de gebruikersinterface.

Notitie

Werkruimtebeheerders kunnen deze functie uitschakelen. Zie Uploaden van gegevens beheren voor meer informatie.

Een tabel maken

U kunt de dbFS-gebruikersinterface voor het maken van tabellen starten door te klikken op Nieuw pictogram Nieuw in de zijbalk of op de knop DBFS in de gebruikersinterface voor het toevoegen van gegevens. U kunt een tabel vullen vanuit bestanden in DBFS of bestanden uploaden.

Met de gebruikersinterface kunt u alleen externe tabellen maken.

  1. Kies een gegevensbron en volg de stappen in de bijbehorende sectie om de tabel te configureren.

    Als een beheerder van een Azure Databricks-werkruimte de optie Bestand uploaden heeft uitgeschakeld, hebt u niet de mogelijkheid om bestanden te uploaden. U kunt tabellen maken met een van de andere gegevensbronnen.

    Instructies voor het uploaden van bestand

    1. Sleep bestanden naar de dropzone Bestanden of klik op de dropzone om door bestanden te bladeren en bestanden te kiezen. Na het uploaden wordt een pad weergegeven voor elk bestand. Het pad zal er ongeveer als /FileStore/tables/<filename>-<integer>.<file-type>volgt uitzien. U kunt dit pad in een notebook gebruiken om gegevens te lezen.
    2. Klik op Tabel maken met de gebruikersinterface.
    3. Kies een cluster in de vervolgkeuzelijst Cluster.

    Instructies voor DBFS

    1. Een bestand selecteren.
    2. Klik op Tabel maken met de gebruikersinterface.
    3. Kies een cluster in de vervolgkeuzelijst Cluster.
  2. Klik op Voorbeeldtabel om de tabel weer te geven.

  3. In het veld Tabelnaam overschrijft u desgewenst de standaardtabelnaam. Een tabelnaam mag alleen kleine alfanumerieke tekens en onderstrepingstekens bevatten en moet beginnen met een kleine letter of onderstrepingsteken.

  4. In het veld Maken in database overschrijft u desgewenst de geselecteerde default database.

  5. In het veld Bestandstype kunt u desgewenst het uitgestelde bestandstype overschrijven.

  6. Als het bestandstype CSV is:

    1. Selecteer in het veld Kolomscheidingsteken of u het uitgestelde scheidingsteken wilt overschrijven.
    2. Geef aan of de eerste rij moet worden gebruikt als kolomtitels.
    3. Geef aan of het schema moet worden afgeleid.
  7. Als het bestandstype JSON is, geeft u aan of het bestand meerdere regels heeft.

  8. Klik op Tabel maken.

Databases en tabellen weergeven

Notitie

Werkruimten waarvoor Catalog Explorer is ingeschakeld, hebben geen toegang tot het verouderde gedrag dat hieronder wordt beschreven.

Klik op Cataloguspictogram Catalogus in de zijbalk. Azure Databricks selecteert een actief cluster waartoe u toegang hebt. In de map Databases wordt de lijst met databases weergegeven waarin de default database is geselecteerd. In de map Tabellen wordt de lijst met tabellen in de default database weergegeven.

Lijst met tabellen maken

U kunt het cluster wijzigen in het menu Databases, de gebruikersinterface van de tabel maken of de gebruikersinterface van de tabel weergeven. Bijvoorbeeld in het menu Databases:

  1. Klik op de Omlaag caret pijl-omlaag boven aan de map Databases.

  2. Selecteer een cluster.

    Cluster selecteren

Tabeldetails weergeven

In de tabeldetailsweergave ziet u het tabelschema en voorbeeldgegevens.

  1. Klik op Cataloguspictogram Catalogus in de zijbalk.

  2. Klik in de map Databases op een database.

  3. Klik in de map Tabellen op de tabelnaam.

  4. Selecteer eventueel een ander cluster in de vervolgkeuzelijst Cluster om het voorbeeld van de tabel weer te geven.

    Tabeldetails

    Notitie

    Als u de voorbeeldweergave van de tabel wilt weergeven, wordt een Spark SQL-query uitgevoerd op het cluster dat is geselecteerd in de vervolgkeuzelijst Cluster . Als er al een workload op het cluster wordt uitgevoerd, kan het laden van het tabelvoorbeeld langer duren.

Een tabel verwijderen met behulp van de gebruikersinterface

  1. Klik op Cataloguspictogram Catalogus in de zijbalk.
  2. Klik op de Vervolgkeuzemenu volgende tabelnaam en selecteer Verwijderen.