In dit artikel vindt u aanbevelingen voor de wijze waarop beheerders en andere hoofdgebruikers verbindingen tussen Azure Databricks en gegevensbronnen kunnen configureren. Als u probeert te bepalen of u toegang hebt tot het lezen van gegevens vanuit een extern systeem, controleert u eerst de gegevens waartoe u toegang hebt in uw werkruimte. Zie Gegevens ontdekken.
U kunt uw Azure Databricks-account verbinden met gegevensbronnen zoals opslag van cloudobjecten, relationele databasebeheersystemen, streaminggegevensservices en bedrijfsplatforms zoals CRL's. De specifieke bevoegdheden die nodig zijn om verbindingen te configureren, zijn afhankelijk van de gegevensbron, hoe machtigingen in uw Azure Databricks-werkruimte worden geconfigureerd, de vereiste machtigingen voor interactie met gegevens in de bron, uw gegevensbeheermodel en de gewenste methode voor het maken van verbinding.
Voor de meeste methoden zijn verhoogde bevoegdheden vereist voor zowel de gegevensbron als de Azure Databricks-werkruimte om de benodigde machtigingen te configureren voor het integreren van systemen. Gebruikers zonder deze machtigingen moeten hulp vragen. Zie Toegang tot gegevensbronnen aanvragen.
Objectopslagverbindingen configureren
Cloudobjectopslag biedt de basis voor het opslaan van de meeste gegevens in Azure Databricks. Voor meer informatie over opslag van cloudobjecten en waar Azure Databricks gegevens opslaat, zie Waar schrijft Azure Databricks gegevens?.
Zie Netwerken als u netwerken wilt configureren voor cloudobjectopslag.
Verbindingen met externe gegevenssystemen configureren
Databricks raadt verschillende opties aan voor het configureren van verbindingen met externe gegevenssystemen, afhankelijk van uw behoeften. De volgende tabel bevat een algemeen overzicht van deze opties:
Optie
Omschrijving
Lakehouse Federation
Biedt alleen-lezentoegang tot gegevens in bedrijfsgegevenssystemen. Verbindingen worden geconfigureerd via Unity Catalog op catalogus- of schemaniveau, waarbij meerdere tabellen worden gesynchroniseerd met één configuratie. Zie Wat is Lakehouse Federation?
Partner Connect
Maakt gebruik van oplossingen van technologiepartner om verbinding te maken met externe gegevensbronnen en het automatiseren van het opnemen van gegevens naar het lakehouse. Sommige oplossingen omvatten ook omgekeerde ETL en directe toegang tot lakehouse-gegevens van externe systemen. Zie Wat is Databricks Partner Connect?
Stuurprogramma's
Azure Databricks bevat stuurprogramma's voor externe gegevenssystemen in elke Databricks Runtime. U kunt desgewenst stuurprogramma's van derden installeren voor toegang tot gegevens in andere systemen. U moet verbindingen voor elke tabel configureren. Sommige stuurprogramma's bevatten schrijftoegang. Zie Verbinding maken met externe systemen.
JDBC
Verschillende meegeleverde stuurprogramma's voor externe systemen zijn gebaseerd op systeemeigen JDBC-ondersteuning en de JDBC-optie biedt uitbreidbare opties voor het configureren van verbindingen met andere systemen. U moet verbindingen voor elke tabel configureren. Zie Querydatabases met behulp van JDBC.
Verbinding maken met streaminggegevensbronnen
Azure Databricks biedt geoptimaliseerde connectors voor veel streaminggegevenssystemen.
Voor alle streaminggegevensbronnen moet u referenties genereren die toegang bieden en deze referenties laden in Azure Databricks. Databricks raadt aan referenties op te slaan met behulp van geheimen, omdat u geheimen kunt gebruiken voor alle configuratieopties en in alle toegangsmodi.
Alle gegevensconnectors voor streamingbronnen ondersteunen het doorgeven van referenties via opties bij het definiëren van streamingqueries. Zie Streaminggegevensbronnen configureren.
Toegang tot gegevensbronnen aanvragen
In veel organisaties hebben de meeste gebruikers onvoldoende bevoegdheden voor Azure Databricks of externe gegevensbronnen om gegevensverbindingen te configureren.
Uw organisatie heeft mogelijk al toegang tot een gegevensbron geconfigureerd met behulp van een van de patronen die worden beschreven in de artikelen die op deze pagina zijn gekoppeld. Als uw organisatie een goed gedefinieerd proces heeft voor het aanvragen van toegang tot gegevens, raadt Databricks aan dat proces te volgen.
Als u niet zeker weet hoe u toegang krijgt tot een gegevensbron, kan deze procedure u helpen:
Gebruik Catalog Explorer om de tabellen en volumes weer te geven waartoe u toegang hebt. Zie Wat is Catalog Explorer?.
Vraag uw teamleden of managers over de gegevensbronnen waartoe ze toegang hebben.
De meeste organisaties gebruiken groepen die zijn gesynchroniseerd vanaf hun id-provider (bijvoorbeeld Okta of Microsoft Entra ID) om machtigingen voor werkruimtegebruikers te beheren. Als andere leden van uw team toegang hebben tot gegevensbronnen waartoe u toegang nodig hebt, moet u een werkruimtebeheerder aan de juiste groep toevoegen om u toegang te verlenen.
Als een bepaalde tabel, volume of gegevensbron is geconfigureerd door een collega, moet die persoon machtigingen hebben om u toegang te verlenen tot de gegevens.
Sommige organisaties configureren machtigingen voor gegevenstoegang via instellingen voor rekenclusters en SQL-warehouses.
De toegang tot gegevensbronnen kan per rekenproces variëren.
U kunt de maker van de rekenkracht bekijken op het tabblad Compute . Neem contact op met de maker om te vragen over gegevensbronnen die toegankelijk moeten zijn.
Demonstreer inzicht in algemene data engineering-taken voor het implementeren en beheren van data engineering-workloads in Microsoft Azure met behulp van een aantal Azure-services.
Meer informatie over Azure Databricks, een geïntegreerd analyseplatform voor gegevensanalisten, gegevenstechnici, gegevenswetenschappers en machine learning-engineers.
Meer informatie over wat een Azure Databricks-notebook is en hoe u notebooks gebruikt en beheert om uw gegevens te verwerken, analyseren en visualiseren.
Meer informatie over het vinden van gegevenssets, het weergeven van bestanden, het verkennen van gegevensbeschrijvingen en het detecteren van tabellen in Azure Databricks.