Rozpoczynanie pracy z usługą Azure Databricks

Zakończone

Aby korzystać z usługi Azure Databricks, musisz utworzyć obszar roboczy usługi Azure Databricks w ramach subskrypcji platformy Azure. Obszar roboczy to wdrożenie usługi Azure Databricks na koncie usługi w chmurze. Zapewnia ujednolicone środowisko do pracy z elementami zawartości usługi Azure Databricks dla określonego zestawu użytkowników.

Obszar roboczy usługi Azure Databricks można utworzyć, wykonując następujące czynności:

  • Za pomocą interfejsu użytkownika witryny Azure Portal.
  • Przy użyciu szablonu usługi Azure Resource Manager (ARM), Bicep lub Terraform.
  • Za pomocą polecenia cmdlet New-AzDatabricksWorkspace programu Azure PowerShell.
  • Za pomocą polecenia az databricks workspace create Azure command line interface (CLI).

Podczas tworzenia obszaru roboczego należy określić:

  • Nazwa obszaru roboczego.
  • Wybierz dostępny region. Aby uzyskać informacje o dostępnych regionach, zobacz Usługi platformy Azure dostępne według regionów.
  • Warstwa cenowa:
    • Standardowa — podstawowe możliwości platformy Apache Spark z integracją identyfikatora Entra firmy Microsoft.
    • Premium — kontrola dostępu oparta na rolach i inne funkcje na poziomie przedsiębiorstwa.
    • Wersja próbna — 14-dniowa bezpłatna wersja próbna obszaru roboczego na poziomie premium
  • Nazwa zarządzanej grupy zasobów (opcjonalnie): automatycznie utworzona grupa zasobów, w której platforma Azure aprowizuje zasoby infrastruktury potrzebne dla obszaru roboczego usługi Databricks i zarządza nimi.

Zrzut ekranu przedstawiający usługę Azure Databricks w witrynie Azure Portal.

Jeśli zdecydujesz się utworzyć wdrożenie usługi Azure Databricks przy użyciu interfejsu wiersza polecenia platformy Azure, będzie to polecenie az databricks workspace do zapamiętania:

az databricks workspace create
    --resource-group myresourcegroup \
    --name mydatabricksws  \
    --location westus2  \
    --sku standard

Równoważne polecenie cmdlet programu PowerShell New-AzDatabricksWorkspace :

New-AzDatabricksWorkspace -Name mydatabricksws -ResourceGroupName myresourcegroup -Location westus2 -ManagedResourceGroupName databricks-group -Sku standard

Po aprowizacji obszaru roboczego usługi Azure Databricks możesz użyć interfejsu użytkownika obszaru roboczego do pracy z danymi i zasobami obliczeniowymi. Interfejs użytkownika obszaru roboczego to internetowy interfejs użytkownika, w którym można tworzyć zasoby obszaru roboczego, takie jak klastry Spark i zarządzać nimi, oraz używać notesów i zapytań do pracy z danymi w plikach i tabelach.

Zrzut ekranu przedstawiający interfejs użytkownika obszaru roboczego usługi Azure Databricks.

Strona główna zawiera skróty do typowych zadań i obiektów obszaru roboczego, które ułatwiają rozpoczęcie pracy. Możesz zaimportować dane, utworzyć notatnik, utworzyć zapytanie i skonfigurować eksperyment AutoML.

Pasek boczny zawiera typowe kategorie usługi Databricks (Obszar roboczy, Ostatnie, Wykaz, Zadania i potoki, Obliczenia, Marketplace). Następnie jest podzielony według obszaru produktu:

  • SQL: Edytor SQL, Zapytania, Pulpity nawigacyjne, Genie, Alerty, Historia zapytań, SQL Warehouse
  • Inżynieria danych: wykonania zadań, pozyskiwanie danych
  • Uczenie maszynowe: plac zabaw, eksperymenty, funkcje, modele, obsługa

Wybierz + Nowy aby:

  • Twórz obiekty obszaru roboczego, takie jak notesy, zapytania, repozytoria, pulpity nawigacyjne, alerty, zadania, potoki, eksperymenty, modele i punkty końcowe obsługi.
  • Tworzenie zasobów obliczeniowych , takich jak klastry, magazyny SQL i punkty końcowe uczenia maszynowego.

Użyj górnego paska, aby wyszukać obiekty obszaru roboczego, takie jak notesy, zapytania, pulpity nawigacyjne, alerty, pliki, foldery, biblioteki, tabele zarejestrowane w Unity Catalog, zadania i repozytoria w jednym centralnym miejscu. Na pasku wyszukiwania można również uzyskać dostęp do ostatnio wyświetlanych obiektów.

Obszar roboczy jest dostępny w wielu językach. Aby zmienić język obszaru roboczego, wybierz swoją nazwę użytkownika na górnym pasku nawigacyjnym, wybierz pozycję Ustawienia i przejdź do karty Preferencje .

Uzyskiwanie pomocy od asystenta usługi Databricks

Databricks Assistant to programista programujący w parach i narzędzie wsparcia oparte na sztucznej inteligencji, które pomaga wydajniej pracować w środowisku Databricks, generując, wyjaśniając i naprawiając kod lub zapytania bezpośrednio w notatnikach, pulpitach nawigacyjnych i plikach.

Zrzut ekranu przedstawiający asystenta usługi Azure Databricks.

Może ona pomóc w wielu zadaniach, w tym identyfikowaniu i poprawianiu błędów, tworzeniu wizualizacji danych, diagnozowaniu problemów z zadaniami oraz filtrowaniu lub analizowaniu danych przy użyciu monitów języka naturalnego. Asystent może wyświetlić odpowiednie wskazówki z dokumentacji Azure Databricks.

Dzięki użyciu metadanych Unity Catalog, personalizuje odpowiedzi na podstawie zasobów danych w waszej organizacji — tabel, kolumn i opisów — co ułatwia eksplorację i pracę z danymi.