Delen via


Ontwikkelen met Databricks

Databricks-ontwikkelaarsgebruikers omvatten de gegevenswetenschappers, data engineers, gegevensanalisten, machine learning-engineers en DevOps- en MLOps-engineers: alle bouwoplossingen en integraties om Databricks uit te breiden en aan te passen aan hun specifieke behoeften. Naast de vele Databricks-API's en data engineering-functies die beschikbaar zijn in de werkruimte, zijn er ook veel hulpprogramma's om verbinding te maken met Databricks en lokaal te ontwikkelen die ontwikkelaars van Databricks ondersteunen.

Dit artikel bevat een overzicht van API's en hulpprogramma's die beschikbaar zijn voor gebruikers van Databricks-ontwikkelaars.

Beginnen met coderen in de werkruimte

Ontwikkelen in de werkruimte is een uitstekende manier om snel vertrouwd te raken met Databricks-API's. Databricks ondersteunt Python, SQL, Scala, R en andere op ontwikkelaars gerichte functies in de werkruimte, waaronder handige tools en hulpmiddelen.

Hier volgen enkele manieren om te beginnen:

Aangepaste apps en oplossingen bouwen

Azure Databricks biedt hulpprogramma's voor zowel werkruimte- als lokale ontwikkeling. In de werkruimte kunt u apps maken met behulp van de gebruikersinterface, gegevens zijn eenvoudig toegankelijk in Unity Catalog-volumes en werkruimtebestanden, functies die alleen voor werkruimten beschikbaar zijn, zoals de Databricks Assistant voor foutopsporing, andere functionaliteit zoals notebooks zijn volledig beschikbaar en broncodebeheer is beschikbaar in Git-mappen.

U kunt ook aangepaste oplossingen ontwikkelen met behulp van een IDE op uw lokale computer om te profiteren van de volledige functionaliteit van een uitgebreide ontwikkelomgeving. Lokale ontwikkeling ondersteunt een breder scala aan talen, wat betekent dat taalafhankelijke functies, zoals foutopsporing en testframeworks, beschikbaar zijn om grotere projecten te ondersteunen, samen met directe toegang tot broncodebeheer.

Zie welk hulpprogramma voor ontwikkelaars moet ik gebruiken voor aanbevelingen voor het gebruik van hulpprogramma's.

Kenmerk Beschrijving
verifiëren en autoriseren Configureer verificatie en autorisatie voor uw hulpprogramma's, scripts en apps om te werken met Azure Databricks.
Databricks-apps Maak beveiligde gegevens en aangepaste AI-toepassingen op het Databricks-platform, die u kunt delen met andere gebruikers.
Databricks-extensie voor Visual Studio Code Maak verbinding met uw externe Azure Databricks-werkruimten vanuit Visual Studio Code voor een eenvoudige configuratie van uw verbinding met de Databricks-werkruimte en een gebruikersinterface voor het beheren van Databricks-resources.
PyCharm Databricks-plugin Configureer een verbinding met een externe Databricks-werkruimte en voer bestanden uit op Databricks-clusters vanuit PyCharm. Deze plugin is ontwikkeld en geleverd door JetBrains in samenwerking met Databricks.
Databricks SDK's Automatiseer uw interacties met Databricks met behulp van een SDK, in plaats van de REST API's rechtstreeks aan te roepen. De SDK's zijn ook beschikbaar in de werkruimte.

Verbinding maken met Databricks

Verbinding maken met Databricks is een noodzakelijk onderdeel van veel integraties en oplossingen en Databricks biedt een grote selectie verbindingshulpprogramma's waaruit u kunt kiezen. De volgende tabel bevat hulpprogramma's voor het verbinden van uw ontwikkelomgeving en processen met uw Azure Databricks-werkruimte en -resources.

Kenmerk Beschrijving
Databricks Connect Maak verbinding met Azure Databricks met behulp van populaire geïntegreerde ontwikkelomgevingen (IDE's), zoals PyCharm, IntelliJ IDEA, Eclipse, RStudio en JupyterLab.
Databricks-extensie voor Visual Studio Code Eenvoudige configuratie van uw verbinding met de Databricks-werkruimte en een gebruikersinterface voor het beheren van Databricks-resources.
SQL-stuurprogramma's en -hulpprogramma's Maak verbinding met Azure Databricks om SQL-opdrachten en -scripts uit te voeren, programmatisch te communiceren met Azure Databricks en Azure Databricks SQL-functionaliteit te integreren in toepassingen die zijn geschreven in populaire talen, zoals Python, Go, JavaScript en TypeScript.

Aanbeveling

U kunt ook veel extra populaire hulpprogramma's van derden verbinden met clusters en SQL-warehouses voor toegang tot gegevens in Azure Databricks. Zie de technologiepartners.

Infrastructuur en middelen beheren

Ontwikkelaars en data engineers kunnen kiezen uit de volgende hulpprogramma's om het inrichten en beheren van infrastructuur en resources te automatiseren. Deze hulpprogramma's ondersteunen zowel eenvoudige als gecompliceerde CI/CD-pijplijnscenario's.

Zie welk hulpprogramma voor ontwikkelaars moet ik gebruiken voor aanbevelingen voor het gebruik van hulpprogramma's.

Kenmerk Beschrijving
Databricks-CLI Toegang tot de Functionaliteit van Azure Databricks met behulp van de Opdrachtregelinterface (CLI) van Databricks. De CLI verpakt de Databricks REST API, dus in plaats van REST API-aanroepen rechtstreeks te verzenden met curl of Postman, kunt u de Databricks CLI gebruiken om te communiceren met Databricks. Gebruik de CLI vanuit een lokale terminal of gebruik deze vanuit de webterminal van de werkruimte.
Databricks Asset Bundels Definieer en beheer Databricks-resources en uw CI/CD-pijplijn met aanbevolen procedures voor ontwikkeling, testen en implementatie van industriestandaarden voor uw gegevens en AI-projecten met Databricks Asset Bundles. Dit is een functie van de Databricks CLI.
Databricks Terraform-provider en Terraform CDKTF voor Databricks Azure Databricks-infrastructuur en -resources inrichten met behulp van Terraform.
CI/CD-hulpprogramma's Integreer populaire CI/CD-systemen en -frameworks, zoals GitHub Actions, Jenkins en Apache Airflow.

Samenwerken en code delen

Databricks ondersteunt onder andere andere samenwerkingsfuncties in de werkruimte specifiek ontwikkelaars die willen samenwerken en code in de werkruimte willen delen met deze functies:

Kenmerk Beschrijving
UDF's UDF's (door de gebruiker gedefinieerde functies) ontwikkelen om code opnieuw te gebruiken en te delen.
Git-mappen Configureer Git-mappen voor bijdragen van versie- en broncodebeheer aan uw Databricks-projectbestanden.

Contact opnemen met de Databricks-ontwikkelaarscommunity

Databricks heeft een actieve ontwikkelaarscommunity die wordt ondersteund door de volgende programma's en resources: