Sdílet prostřednictvím


místních vývojových nástrojů

Databricks poskytuje ekosystém nástrojů, které vám pomůžou vyvíjet aplikace a řešení, které se integrují s Azure Databricks a programově spravují prostředky a data Databricks.

Tento článek obsahuje přehled těchto nástrojů a doporučení pro nejlepší nástroje pro běžné scénáře vývojářů.

Jaké nástroje databricks nabízí pro místní vývoj?

Následující tabulka obsahuje seznam vývojářských nástrojů, které poskytuje Databricks.

Nástroj Popis
Ověřování a autorizace Nakonfigurujte ověřování a autorizaci pro vaše nástroje, skripty a aplikace pro práci s Azure Databricks.
Databricks Connect Připojte se k Azure Databricks pomocí oblíbených integrovaných vývojových prostředí (IDE), jako jsou PyCharm, IntelliJ IDEA, Eclipse, RStudio a JupyterLab.
Pokud používáte Visual Studio Code, Databricks doporučuje rozšíření Databricks pro Visual Studio Code, které je postavené na databricks Connect, protože poskytuje další funkce, které umožňují snadnější konfiguraci.
Rozšíření Databricks pro Visual Studio Code Připojte se z integrovaného vývojového prostředí (IDE) Visual Studio Code ke vzdáleným pracovním prostorům Azure Databricks.
Zásuvný modul PyCharm Databricks Nakonfigurujte připojení ke vzdálenému pracovnímu prostoru Databricks a spusťte soubory v clusterech Databricks z PyCharm. Tento modul plug-in je vyvinut a poskytován JetBrains ve spolupráci s Databricks.
Databricks SDK Automatizujte Azure Databricks z knihoven kódu napsaných pro oblíbené jazyky, jako jsou Python, Java, Go a R. Místo přímého odesílání volání rozhraní REST API pomocí curl nebo Postmanu použijte sadu SDK k interakci s Databricks pomocí programovacího jazyka podle vašeho výběru. Sady SDK Databricks podporují kompletní rozhraní REST API a poskytují další funkce, včetně sjednoceného ověřování a stránkování, které usnadňují jejich použití a rozšíření tak, aby zahrnovaly celou řadu scénářů.
Ovladače a nástroje SQL Připojte se k Azure Databricks, abyste mohli spouštět příkazy a skripty SQL, pracovat programově s Azure Databricks a integrovat funkce SQL Azure Databricks do aplikací psaných v oblíbených jazycích, jako je Python, Go, JavaScript a TypeScript.
Rozhraní příkazového řádku Databricks Přístup k funkcím Azure Databricks pomocí rozhraní příkazového řádku Databricks (CLI). Rozhraní příkazového řádku zabalí rozhraní REST API Databricks, takže místo přímého odesílání volání rozhraní REST API pomocí nástroje curl nebo Postman použijte rozhraní příkazového řádku Databricks k interakci s Databricks.
Balíčky prostředků Databricks Implementace osvědčených postupů pro vývoj, testování a nasazení (CI/CD) pro vaše projekty Azure Databricks a AI s využitím sad prostředků Databricks
Poskytovatel Terraform pro Databricks a Terraform CDKTF pro Databricks Zřiďte infrastrukturu a prostředky Azure Databricks pomocí Terraformu.
Nástroje CI/CD Integrujte oblíbené systémy a frameworky CI/CD, jako GitHub Actions, Jenkins a Apache Airflow.

Návod

K clusterům a skladům SQL pro přístup k datům v Azure Databricks můžete také připojit mnoho dalších oblíbených nástrojů třetích stran. Další informace naleznete v tématu Technologické partnery.

Který vývojářský nástroj mám použít?

Následující tabulka popisuje doporučení nástrojů Databricks pro běžné scénáře vývojářů.

Nástroj Doporučení k používání
Rozšíření Databricks pro Visual Studio Code
Zásuvný modul PyCharm Databricks
Pro jiná IDE použijte Databricks CLI s Databricks Connect.
  • Interaktivní vývoj a ladění z místního integrovaného vývojového prostředí (IDE)
Rozhraní příkazového řádku Databricks
  • Přímá interakce s Databricks z příkazového řádku
  • Skriptování prostředí
  • Experimentování
  • Přímé vyvolání rozhraní REST API
  • Správa místních profilů ověřování
  • Synchronizace kódu z integrovaného vývojového prostředí (IDE) do pracovního prostoru Databricks
Balíčky prostředků Databricks (funkce příkazového řádku)
  • Správa pracovních postupů a nasazení projektů do Databricks
  • Použití osvědčených postupů CI/CD
  • Spolu verze, spoluautor, spolunasazení vašich zdrojů a prostředků jako jednolitá jednotka
  • Podporuje nejběžnější zdroje.
Poskytovatel Terraformu pro Databricks
  • Infrastruktura jako kód, CI/CD
  • Správa a vytváření pracovních prostorů, katalogů, metastorů a vynucení oprávnění
  • Záruka přenositelnosti prostředí a zotavení po havárii
  • Mnoho podporovaných prostředků
Databricks Python SDK
Databricks Java SDK
Databricks Go SDK
Databricks R SDK
  • Vývoj aplikací
  • Integrace se stávajícími systémy nasazení
  • Vytváření vlastních pracovních postupů Databricks a nových webových služeb
Ovladače SQL
  • Spouštění příkazů a skriptů SQL z klientských aplikací
rozhraní REST API Databricks
  • Automatizace procesů, kdy sada SDK ve vašem preferovaném programovacím jazyce není dostupná
  • Pouze pokročilé scénáře
  • Téměř všechny prostředky Databricks jsou k dispozici.