Dela via


Anslut till datakällor

Den här artikeln innehåller rekommendationer om hur administratörer och andra energianvändare kan konfigurera anslutningar mellan Azure Databricks och datakällor. Om du försöker avgöra om du har åtkomst till att läsa data från ett externt system börjar du med att granska de data som du har åtkomst till på din arbetsyta. Se Identifiera data.

Du kan ansluta ditt Azure Databricks-konto till datakällor som lagring av molnobjekt, hanteringssystem för relationsdatabaser, strömmande datatjänster och företagsplattformar som CRM:er. De specifika behörigheter som krävs för att konfigurera anslutningar beror på datakällan, hur behörigheter på din Azure Databricks-arbetsyta konfigureras, vilka behörigheter som krävs för att interagera med data i källan, din datastyrningsmodell och vilken metod du föredrar för att ansluta.

De flesta metoder kräver utökade privilegier på både datakällan och Azure Databricks-arbetsytan för att konfigurera nödvändiga behörigheter för att integrera system. Användare utan dessa behörigheter bör begära hjälp. Se Begär åtkomst till datakällor.

Konfigurera objektlagringsanslutningar

Lagring av molnobjekt utgör grunden för lagring av de flesta data på Azure Databricks. Mer information om lagring av molnobjekt och var Azure Databricks lagrar data finns i Var skriver Azure Databricks data?.

Databricks rekommenderar att du använder Unity Catalog för att konfigurera åtkomst till molnobjektlagring. Unity Catalog tillhandahåller datastyrning för både strukturerade och ostrukturerade data i molnobjektlagring. Se Ansluta till molnobjektlagring med Unity Catalog.

Kunder som inte använder Unity Catalog måste konfigurera anslutningar med äldre metoder. Se Konfigurera åtkomst till molnobjektlagring för Azure Databricks.

Information om hur du konfigurerar nätverk till molnobjektlagring finns i Nätverk.

Konfigurera anslutningar till externa datasystem

Databricks rekommenderar flera alternativ för att konfigurera anslutningar till externa datasystem beroende på dina behov. Följande tabell innehåller en översikt på hög nivå över dessa alternativ:

Alternativ Description
Lakehouse Federation Ger skrivskyddad åtkomst till data i företagsdatasystem. Anslutningar konfigureras via Unity Catalog på katalog- eller schemanivå och synkroniserar flera tabeller med en enda konfiguration. Se Vad är Lakehouse Federation?.
Partneranslutning Utnyttjar teknikpartnerlösningar för att ansluta till externa datakällor och automatisera inmatning av data till lakehouse. Vissa lösningar omfattar även omvänd ETL och direkt åtkomst till lakehouse-data från externa system. Se Vad är Databricks Partner Connect?
Drivrutiner Azure Databricks innehåller drivrutiner för externa datasystem i varje Databricks Runtime. Du kan också installera drivrutiner från tredje part för att komma åt data i andra system. Du måste konfigurera anslutningar för varje tabell. Vissa drivrutiner inkluderar skrivåtkomst. Se Ansluta till externa system.
JDBC Flera inkluderade drivrutiner för externa system bygger på inbyggt JDBC-stöd, och JDBC-alternativet innehåller utökningsbara alternativ för att konfigurera anslutningar till andra system. Du måste konfigurera anslutningar för varje tabell. Se Fråga databaser med JDBC.

Ansluta till strömmande datakällor

Azure Databricks tillhandahåller optimerade anslutningsappar för många strömmande datasystem.

För alla strömmande datakällor måste du generera autentiseringsuppgifter som ger åtkomst och läser in dessa autentiseringsuppgifter i Azure Databricks. Databricks rekommenderar att du lagrar autentiseringsuppgifter med hjälp av hemligheter, eftersom du kan använda hemligheter för alla konfigurationsalternativ och i alla åtkomstlägen.

Alla dataanslutningar för strömningskällor har stöd för att skicka autentiseringsuppgifter med hjälp av alternativ när du definierar strömmande frågor. Se Konfigurera strömmande datakällor.

Begär åtkomst till datakällor

I många organisationer har de flesta användare inte tillräcklig behörighet för vare sig Azure Databricks eller externa datakällor för att konfigurera dataanslutningar.

Din organisation kanske redan har konfigurerat åtkomst till en datakälla med något av de mönster som beskrivs i artiklarna som är länkade från den här sidan. Om din organisation har en väldefinierad process för att begära åtkomst till data rekommenderar Databricks att du följer den processen.

Om du är osäker på hur du får åtkomst till en datakälla kan den här proceduren hjälpa dig:

  1. Använd Katalogutforskaren för att visa de tabeller och volymer som du kan komma åt. Se Vad är Katalogutforskaren?.
  2. Fråga dina teammedlemmar eller chefer om de datakällor som de kan komma åt.
    • De flesta organisationer använder grupper som synkroniserats från sin identitetsprovider (till exempel Okta eller Microsoft Entra ID) för att hantera behörigheter för arbetsyteanvändare. Om andra medlemmar i ditt team kan komma åt datakällor som du behöver åtkomst till, måste en arbetsyteadministratör lägga till dig i rätt grupp för att ge dig åtkomst.
    • Om en viss tabell, volym eller datakälla har konfigurerats av en medarbetare bör den personen ha behörighet att ge dig åtkomst till data.
  3. Vissa organisationer konfigurerar behörigheter för dataåtkomst via inställningar för beräkningskluster och SQL-lager.
    • Åtkomsten till datakällor kan variera beroende på beräkning.
    • Du kan visa beräkningsskapare på fliken Beräkning . Kontakta skaparen om du vill fråga efter datakällor som ska vara tillgängliga.