Verbinding maken met gegevensbronnen

Artikel
23-01-2025

In dit artikel vindt u aanbevelingen voor de wijze waarop beheerders en andere hoofdgebruikers verbindingen tussen Azure Databricks en gegevensbronnen kunnen configureren. Als u probeert te bepalen of u toegang hebt tot het lezen van gegevens vanuit een extern systeem, controleert u eerst de gegevens waartoe u toegang hebt in uw werkruimte. Zie Gegevens ontdekken.

Notitie

Zie Toegang tot externe cloudservices beheren met servicereferentiesvoor informatie over het maken van verbinding met externe services die niet noodzakelijkerwijs gegevensbronnen zijn.

U kunt uw Azure Databricks-account verbinden met gegevensbronnen zoals opslag van cloudobjecten, relationele databasebeheersystemen, streaminggegevensservices en bedrijfsplatforms zoals CRL's. De specifieke bevoegdheden die nodig zijn om verbindingen te configureren, zijn afhankelijk van de gegevensbron, hoe machtigingen in uw Azure Databricks-werkruimte worden geconfigureerd, de vereiste machtigingen voor interactie met gegevens in de bron, uw gegevensbeheermodel en de gewenste methode voor het maken van verbinding.

Voor de meeste methoden zijn verhoogde bevoegdheden vereist voor zowel de gegevensbron als de Azure Databricks-werkruimte om de benodigde machtigingen te configureren voor het integreren van systemen. Gebruikers zonder deze machtigingen moeten hulp vragen. Zie Toegang tot gegevensbronnen aanvragen.

Objectopslagverbindingen configureren

Cloudobjectopslag biedt de basis voor het opslaan van de meeste gegevens in Azure Databricks. Voor meer informatie over opslag van cloudobjecten en waar Azure Databricks gegevens opslaat, zie Waar schrijft Azure Databricks gegevens?.

Databricks raadt het gebruik van Unity Catalog aan om toegang tot cloudobjectopslag te configureren. Unity Catalog biedt gegevensbeheer voor gestructureerde en ongestructureerde gegevens in de opslag van cloudobjecten. Zie Verbinding maken met cloudobjectopslag en -services met behulp van Unity Catalog.

Klanten die geen Unity Catalog gebruiken, moeten verbindingen configureren met behulp van verouderde methoden. Zie Toegang tot cloudobjectopslag configureren voor Azure Databricks.

Zie Netwerken als u netwerken wilt configureren voor cloudobjectopslag.

Verbindingen met externe gegevenssystemen configureren

Databricks raadt verschillende opties aan voor het configureren van verbindingen met externe gegevenssystemen, afhankelijk van uw behoeften. De volgende tabel bevat een algemeen overzicht van deze opties:

Optie	Omschrijving
Lakehouse Federation	Biedt alleen-lezentoegang tot gegevens in bedrijfsgegevenssystemen. Verbindingen worden geconfigureerd via Unity Catalog op catalogus- of schemaniveau, waarbij meerdere tabellen worden gesynchroniseerd met één configuratie. Zie Wat is Lakehouse Federation?
Partner Connect	Maakt gebruik van oplossingen van technologiepartner om verbinding te maken met externe gegevensbronnen en het automatiseren van het opnemen van gegevens naar het lakehouse. Sommige oplossingen omvatten ook omgekeerde ETL en directe toegang tot lakehouse-gegevens van externe systemen. Zie Wat is Databricks Partner Connect?
Stuurprogramma's	Azure Databricks bevat stuurprogramma's voor externe gegevenssystemen in elke Databricks Runtime. U kunt desgewenst stuurprogramma's van derden installeren voor toegang tot gegevens in andere systemen. U moet verbindingen voor elke tabel configureren. Sommige stuurprogramma's bevatten schrijftoegang. Zie Verbinding maken met externe systemen.
JDBC	Verschillende meegeleverde stuurprogramma's voor externe systemen zijn gebaseerd op systeemeigen JDBC-ondersteuning en de JDBC-optie biedt uitbreidbare opties voor het configureren van verbindingen met andere systemen. U moet verbindingen voor elke tabel configureren. Zie Querydatabases met behulp van JDBC.

Verbinding maken met streaminggegevensbronnen

Azure Databricks biedt geoptimaliseerde connectors voor veel streaminggegevenssystemen.

Voor alle streaminggegevensbronnen moet u referenties genereren die toegang bieden en deze referenties laden in Azure Databricks. Databricks raadt aan referenties op te slaan met behulp van geheimen, omdat u geheimen kunt gebruiken voor alle configuratieopties en in alle toegangsmodi.

Alle gegevensconnectors voor streamingbronnen ondersteunen het doorgeven van referenties via opties bij het definiëren van streamingqueries. Zie Streaminggegevensbronnen configureren.

Toegang tot gegevensbronnen aanvragen

In veel organisaties hebben de meeste gebruikers onvoldoende bevoegdheden voor Azure Databricks of externe gegevensbronnen om gegevensverbindingen te configureren.

Uw organisatie heeft mogelijk al toegang tot een gegevensbron geconfigureerd met behulp van een van de patronen die worden beschreven in de artikelen die op deze pagina zijn gekoppeld. Als uw organisatie een goed gedefinieerd proces heeft voor het aanvragen van toegang tot gegevens, raadt Databricks aan dat proces te volgen.

Als u niet zeker weet hoe u toegang krijgt tot een gegevensbron, kan deze procedure u helpen:

Gebruik Catalog Explorer om de tabellen en volumes weer te geven waartoe u toegang hebt. Zie Wat is Catalog Explorer?.
Vraag uw teamleden of managers over de gegevensbronnen waartoe ze toegang hebben.
- De meeste organisaties gebruiken groepen die zijn gesynchroniseerd vanaf hun id-provider (bijvoorbeeld Okta of Microsoft Entra ID) om machtigingen voor werkruimtegebruikers te beheren. Als andere leden van uw team toegang hebben tot gegevensbronnen waartoe u toegang nodig hebt, moet u een werkruimtebeheerder aan de juiste groep toevoegen om u toegang te verlenen.
- Als een bepaalde tabel, volume of gegevensbron is geconfigureerd door een collega, moet die persoon machtigingen hebben om u toegang te verlenen tot de gegevens.
Sommige organisaties configureren machtigingen voor gegevenstoegang via instellingen voor rekenclusters en SQL-warehouses.
- De toegang tot gegevensbronnen kan per rekenproces variëren.
- U kunt de maker van de rekenkracht bekijken op het tabblad Compute . Neem contact op met de maker om te vragen over gegevensbronnen die toegankelijk moeten zijn.

Aanvullende resources

Documentatie

Aan de slag met Azure Databricks - Azure Databricks

Meer informatie over hoe u aan de slag gaat met Databricks.
Gegevens opnemen in een Databricks Lakehouse - Azure Databricks

Meer informatie over de verschillende manieren om gegevens op te nemen in een lakehouse.
Documentatie voor Azure Databricks

Meer informatie over Azure Databricks, een geïntegreerd analyseplatform voor gegevensanalisten, gegevenstechnici, gegevenswetenschappers en machine learning-engineers.
Inleiding tot Databricks-notebooks - Azure Databricks

Meer informatie over wat een Azure Databricks-notebook is en hoe u notebooks gebruikt en beheert om uw gegevens te verwerken, analyseren en visualiseren.
Where doet Azure Databricks gegevens schrijven? - Azure Databricks

Leer hoe where Azure Databricks gegevensbestanden schrijft.
Gegevens ontdekken - Azure Databricks

Meer informatie over het vinden van gegevenssets, het weergeven van bestanden, het verkennen van gegevensbeschrijvingen en het detecteren van tabellen in Azure Databricks.
Query's uitvoeren op gegevens - Azure Databricks

Meer informatie over het opvragen van gegevens uit lakehouse en externe systemen van Azure Databricks.
Uw abonnement beheren - Azure Databricks

Meer informatie over het beheren van uw Azure Databricks-accountabonnement. Inclusief het verwijderen van het account.

Training

Module

Azure Databricks verkennen - Training

Azure Databricks verkennen

Certificering

Microsoft Gecertificeerd: Azure Data Engineer Associate - Certifications

Demonstreer inzicht in algemene data engineering-taken voor het implementeren en beheren van data engineering-workloads in Microsoft Azure met behulp van een aantal Azure-services.

Delen via