Integracja rozwiązania DBeaver z usługą Azure Databricks

Uwaga

W tym artykule opisano rozwiązanie DBeaver, które nie jest ani udostępniane ani obsługiwane przez usługę Databricks. Aby skontaktować się z dostawcą, zobacz stronę Problemy w repozytorium dbeaver/dbeaver w usłudze GitHub.

DBeaver to lokalne, wieloplatformowe narzędzie bazy danych dla deweloperów, administratorów baz danych, analityków danych, inżynierów danych i innych osób, które muszą pracować z bazami danych. Usługa DBeaver obsługuje usługę Azure Databricks, a także inne popularne bazy danych.

W tym artykule opisano sposób używania lokalnej maszyny deweloperów do instalowania, konfigurowania i używania bezpłatnej wersji DBeaver Community Edition (CE) typu open source do pracy z bazami danych w usłudze Azure Databricks.

Uwaga

Ten artykuł został przetestowany z systemami macOS, Databricks JDBC Driver w wersji 2.6.36 i DBeaver CE w wersji 23.3.0.

Wymagania

Przed zainstalowaniem narzędzia DBeaver lokalna maszyna deweloperza musi spełniać następujące wymagania:

  • System operacyjny Linux 64-bitowy, macOS lub Windows 64-bitowy. (System Linux 32-bitowy jest obsługiwany, ale nie jest zalecany).
  • Sterownik JDBC usługi Databricks na lokalnej maszynie dewelopera, wyodrębniając DatabricksJDBC42.jar plik z pobranego DatabricksJDBC42-<version>.zip pliku.

Aby nawiązać połączenie z usługą DBeaver, musisz również mieć klaster usługi Azure Databricks lub usługę SQL Warehouse.

Krok 1. Instalowanie narzędzia DBeaver

Pobierz i zainstaluj aplikację DBeaver CE w następujący sposób:

  • Linux: pobierz i uruchom jeden z instalatorów systemu Linux ze strony Pobieranie w witrynie internetowej narzędzia DBeaver. snap Opcje flatpak instalacji są również dostępne na tej stronie.
  • macOS: użyj oprogramowania Homebrew , aby uruchomić brew install --cask dbeaver-communityprogram , lub użyj narzędzia MacPorts do uruchomienia polecenia sudo port install dbeaver-community. Instalator systemu macOS jest również dostępny na stronie Pobieranie w witrynie internetowej narzędzia DBeaver.
  • Windows: użyj narzędzia Chocolatey , aby uruchomić polecenie choco install dbeaver. Instalator systemu Windows jest również dostępny na stronie Pobieranie w witrynie internetowej narzędzia DBeaver.

Krok 2. Konfigurowanie sterownika JDBC usługi Azure Databricks dla usługi DBeaver

Skonfiguruj narzędzie DBeaver z informacjami o pobranym wcześniej sterowniku JDBC usługi Databricks.

  1. Uruchom DBeaver.
  2. Jeśli zostanie wyświetlony monit o utworzenie nowej bazy danych, kliknij przycisk Nie.
  3. Jeśli zostanie wyświetlony monit o nawiązanie połączenia z bazą danych lub wybranie jej, kliknij przycisk Anuluj.
  4. Kliknij pozycję Menedżer sterowników bazy danych>.
  5. W oknie dialogowym Menedżer sterowników kliknij przycisk Nowy.
  6. W oknie dialogowym Tworzenie nowego sterownika kliknij kartę Biblioteki.
  7. Kliknij pozycję Dodaj plik.
  8. Przejdź do folderu, do którego wyodrębniono sterownik JDBC usługi Azure Databricks.
  9. Przejdź do jednego poziomu niższego .jar , aby znaleźć plik.
  10. Wyróżnij .jar plik i kliknij przycisk Otwórz.
  11. Na karcie Ustawienia w polu Nazwa sterownika wprowadź wartość Databricks.
  12. Na karcie Ustawienia w polu Nazwa klasy wprowadź wartość com.databricks.client.jdbc.Driver.
  13. Kliknij przycisk OK.
  14. W oknie dialogowym Menedżer sterowników kliknij przycisk Zamknij.

Krok 3. Połączenie DBeaver do baz danych usługi Azure Databricks

Użyj narzędzia DBeaver, aby nawiązać połączenie z klastrem lub usługą SQL Warehouse w celu uzyskania dostępu do baz danych w obszarze roboczym usługi Azure Databricks.

  1. W usłudze DBeaver kliknij pozycję Nowa baza danych > Połączenie ion.

  2. W oknie dialogowym Połączenie do bazy danych na karcie Wszystkie kliknij pozycję Databricks, a następnie kliknij przycisk Dalej.

  3. Kliknij kartę Main (Główny) i wprowadź wartość w polu JDBC URL (Adres URL JDBC) zasobu usługi Azure Databricks. Aby uzyskać informacje o składni pola adresu URL JDBC, zobacz Ustawienia uwierzytelniania sterownika JDBC usługi Databricks.

  4. Kliknij pozycję Testuj połączenie.

    Napiwek

    Przed rozpoczęciem testowania połączenia należy uruchomić zasób usługi Azure Databricks. W przeciwnym razie wykonanie testu może potrwać kilka minut podczas uruchamiania zasobu.

  5. Jeśli połączenie powiedzie się, w oknie dialogowym test Połączenie ion kliknij przycisk OK.

  6. W oknie dialogowym Połączenie do bazy danych kliknij przycisk Zakończ.

W oknie Nawigator bazy danych zostanie wyświetlony wpis usługi Databricks. Aby zmienić nazwę połączenia, aby ułatwić identyfikację:

  1. Kliknij prawym przyciskiem myszy pozycję Databricks, a następnie kliknij polecenie Edytuj Połączenie ion.
  2. W oknie dialogowym konfiguracja Połączenie ion kliknij pozycję Ogólne.
  3. W przypadku nazwy Połączenie ion zastąp Databricks inną nazwą połączenia.
  4. Kliknij przycisk OK.

Powtórz instrukcje opisane w tym kroku dla każdego zasobu, do którego ma uzyskać dostęp usługa DBeaver.

Krok 4. Przeglądanie obiektów danych za pomocą narzędzia DBeaver

Użyj narzędzia DBeaver, aby uzyskać dostęp do obiektów danych w obszarze roboczym usługi Azure Databricks, takich jak tabele i właściwości tabeli, widoki, indeksy, typy danych i inne typy obiektów danych.

  1. W aplikacji DBeaver w oknie Nawigator bazy danych kliknij prawym przyciskiem myszy połączenie, którego chcesz użyć.

  2. Jeśli Połączenie jest włączona, kliknij ją. (Jeśli Połączenie jest wyłączona, masz już połączenie).

    Napiwek

    Przed próbą nawiązania połączenia z zasobem należy uruchomić zasób. W przeciwnym razie ukończenie połączenia może potrwać kilka minut, gdy zasób zostanie uruchomiony.

  3. Rozwiń połączenie, z którym właśnie nawiązaliśmy połączenie.

  4. Rozwiń i przeglądaj dostępne obiekty danych. Kliknij dwukrotnie obiekt danych, aby uzyskać więcej informacji na jego temat.

Powtórz instrukcje opisane w tym kroku, aby uzyskać dostęp do dodatkowych obiektów danych.

Krok 5. Uruchamianie instrukcji SQL przy użyciu narzędzia DBeaver

Użyj narzędzia DBeaver, aby załadować przykładową trips tabelę ze schematu samplesnyctaxi katalogu.

  1. W aplikacji DBeaver w oknie Nawigator bazy danych kliknij prawym przyciskiem myszy połączenie, którego chcesz użyć.

  2. Jeśli Połączenie jest włączona, kliknij ją. (Jeśli Połączenie jest wyłączona, masz już połączenie).

    Napiwek

    Przed próbą nawiązania połączenia z zasobem należy uruchomić zasób. W przeciwnym razie ukończenie połączenia może potrwać kilka minut, gdy zasób zostanie uruchomiony.

  3. Kliknij pozycję Edytor > SQL Nowy skrypt SQL.

  4. Na karcie (nazwa połączenia) Script-1 wprowadź następującą instrukcję SQL:

    SELECT * FROM samples.nyctaxi.trips;
    
  5. Kliknij pozycję Edytor > SQL Wykonaj skrypt SQL.

Następne kroki

Dodatkowe zasoby