Anteckning
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Den här sidan innehåller rekommendationer för administratörer och power-användare som konfigurerar anslutningar mellan Azure Databricks och externa datakällor och tjänster.
Du kan ansluta ditt Azure Databricks-konto till datakällor som lagring av molnobjekt, hanteringssystem för relationsdatabaser, strömmande datatjänster och företagsplattformar som CRM:er. Du kan också ansluta ditt Azure Databricks-konto till externa tjänster som inte är lagringstjänster.
Konfigurera anslutningar till objektlagring
De flesta data som används av Azure Databricks-arbetsbelastningar lagras i molnobjektlagring, till exempel Azure Data Lake Storage eller AWS S3. Du kan hantera åtkomst till molnobjektlagring med något av följande:
Unity Catalog (rekommenderas), som tillhandahåller datastyrning för både strukturerade och ostrukturerade data i molnobjektlagring. Se Ansluta till molnobjektlagring med Unity Catalog.
Äldre kontakter och anslutningsmönster. Se Konfigurera åtkomst till molnobjektlagring för Azure Databricks med äldre mönster.
Konfigurera anslutningar till externa datasystem
Databricks erbjuder flera alternativ för att konfigurera anslutningar till externa datasystem. Följande tabell innehåller en översikt på hög nivå över dessa alternativ:
Alternativ | Beskrivning |
---|---|
Frågefedereringsanslutningar | Lakehouse Federation tillhandahåller skrivskyddad åtkomst till data i företagsdatasystem. Anslutningar konfigureras via Unity Catalog på katalog- eller schemanivå och synkroniserar flera tabeller med en enda konfiguration. Se Vad är Lakehouse Federation?. |
Hanterade datainhämtninganslutningar | sv-SE: Med Lakeflow Connect kan administratörer skapa en anslutning och en hanterad insamlingspipeline samtidigt i datainsamlingsgränssnittet. Se Hanterade kontakter i Lakeflow Connect. Om användarna som ska skapa pipelines är icke-administratörer eller planerar att använda *Databricks APIs*, *Databricks SDKs*, *Databricks CLI* eller *Databricks Asset Bundles*, måste en administratör först skapa anslutningen i Katalogutforskaren. Dessa gränssnitt kräver att användarna anger en befintlig anslutning när de skapar en pipeline. Se Anslut till hanterade inmatningskällor. |
Strömmande anslutningar | Azure Databricks tillhandahåller optimerade anslutningar för många strömmande datasystem. För alla strömmande datakällor måste du generera autentiseringsuppgifter som ger åtkomst och läser in dessa autentiseringsuppgifter i Azure Databricks. Databricks rekommenderar att du lagrar autentiseringsuppgifter med hjälp av hemligheter, eftersom du kan använda hemligheter för alla konfigurationsalternativ och i alla åtkomstlägen. Alla dataanslutningar för strömningskällor har stöd för att överföra autentiseringsuppgifter med hjälp av alternativ när du definierar strömflödesfrågor. Se Standardanslutningar i Lakeflow Connect. |
Tredjepartsintegrationer | Använd tredjepartsverktyg för att ansluta till externa datakällor och automatisera insamlingen av data till lakehouse. Vissa lösningar omfattar även omvänd ETL och direkt åtkomst till lakehouse-data från externa system. Se Vad är Databricks Partner Connect?. |
Förare | Azure Databricks innehåller drivrutiner för externa datasystem i varje Databricks Runtime. Du kan också installera drivrutiner från tredje part för att komma åt data i andra system. Du måste konfigurera anslutningar för varje tabell. Vissa drivrutiner inkluderar skrivåtkomst. Se Ansluta till externa system. För skrivskyddad frågefederation föredras Lakehouse Federation alltid framför dessa drivrutiner. |
JDBC | Flera inkluderade drivrutiner för externa system bygger på inbyggt JDBC-stöd, och JDBC-alternativet innehåller utökningsbara alternativ för att konfigurera anslutningar till andra system. Du måste konfigurera anslutningar för varje tabell. Se Använd databaser med JDBC. För skrivskyddad frågefederation föredras Lakehouse Federation alltid framför dessa drivrutiner. |
Konfigurera anslutningar till externa tjänster
Unity Catalog styr åtkomsten till icke-lagringstjänster med hjälp av ett skyddsbart objekt som kallas tjänstautentiseringsuppgifter. En tjänstautentiseringsuppgift kapslar in en långsiktig molnautentiseringsuppgift som ger åtkomst till en extern tjänst som användarna behöver ansluta till från Azure Databricks. Se Ansluta till externa molntjänster med Unity Catalog
Hantera och begära åtkomst till datakällor och externa tjänster
De flesta anslutningsmetoder kräver utökade privilegier för både den externa datakällan eller tjänsten och Azure Databricks-arbetsytan. I vanliga organisationer har få användare tillräcklig behörighet i antingen Azure Databricks eller hos externa data- och lagringsleverantörer för att själva konfigurera dataanslutningar.
Din organisation kanske redan har konfigurerat åtkomst till en datakälla eller tjänst med något av de mönster som beskrivs i artiklarna som är länkade från den här sidan. Om din organisation har en väldefinierad process för att begära åtkomst till data och tjänster från tredje part rekommenderar Databricks att du följer den processen. Om du är osäker på hur du får åtkomst till en datakälla kan den här proceduren hjälpa dig:
- Använd Katalogutforskaren för att visa de tabeller och volymer som du kan komma åt. Se Vad är Katalogutforskaren?.
- Fråga dina teammedlemmar eller chefer om de datakällor som de kan komma åt.
- De flesta organisationer använder grupper som synkroniserats från sin identitetsprovider (till exempel Okta eller Microsoft Entra ID) för att hantera behörigheter för arbetsyteanvändare. Om andra medlemmar i ditt team kan komma åt datakällor som du behöver åtkomst till, måste en arbetsyteadministratör lägga till dig i rätt grupp för att bevilja åtkomst.
- Om en viss tabell, volym eller datakälla har konfigurerats av en medarbetare bör den personen kunna ge dig åtkomst till data.
Vissa organisationer kopplar dataåtkomstbehörigheter till specifika beräkningskluster och SQL-lager. Det här är en äldre styrningsmodell, men om din organisation använder den och du vill veta vilka datakällor som är tillgängliga för en specifik beräkningsresurs kontaktar du den beräkningsskapare som visas på fliken Beräkning .