Rozpoczynanie pracy z usługą Azure Databricks
Aby korzystać z usługi Azure Databricks, musisz utworzyć obszar roboczy usługi Azure Databricks w ramach subskrypcji platformy Azure. Obszar roboczy to wdrożenie usługi Azure Databricks na koncie usługi w chmurze. Zapewnia ujednolicone środowisko do pracy z elementami zawartości usługi Azure Databricks dla określonego zestawu użytkowników.
Obszar roboczy usługi Azure Databricks można utworzyć, wykonując następujące czynności:
- Za pomocą interfejsu użytkownika witryny Azure Portal.
- Przy użyciu szablonu usługi Azure Resource Manager (ARM), Bicep lub Terraform.
- Za pomocą polecenia cmdlet New-AzDatabricksWorkspace programu Azure PowerShell.
- Za pomocą polecenia az databricks workspace create Azure command line interface (CLI).
Podczas tworzenia obszaru roboczego należy określić:
- Nazwa obszaru roboczego.
- Wybierz dostępny region. Aby uzyskać informacje o dostępnych regionach, zobacz Usługi platformy Azure dostępne według regionów.
-
Warstwa cenowa:
- Standardowa — podstawowe możliwości platformy Apache Spark z integracją identyfikatora Entra firmy Microsoft.
- Premium — kontrola dostępu oparta na rolach i inne funkcje na poziomie przedsiębiorstwa.
- Wersja próbna — 14-dniowa bezpłatna wersja próbna obszaru roboczego na poziomie premium
- Nazwa zarządzanej grupy zasobów (opcjonalnie): automatycznie utworzona grupa zasobów, w której platforma Azure aprowizuje zasoby infrastruktury potrzebne dla obszaru roboczego usługi Databricks i zarządza nimi.
Jeśli zdecydujesz się utworzyć wdrożenie usługi Azure Databricks przy użyciu interfejsu wiersza polecenia platformy Azure, będzie to polecenie az databricks workspace do zapamiętania:
az databricks workspace create
--resource-group myresourcegroup \
--name mydatabricksws \
--location westus2 \
--sku standard
Równoważne polecenie cmdlet programu PowerShell New-AzDatabricksWorkspace :
New-AzDatabricksWorkspace -Name mydatabricksws -ResourceGroupName myresourcegroup -Location westus2 -ManagedResourceGroupName databricks-group -Sku standard
Nawigowanie po interfejsie użytkownika obszaru roboczego usługi Azure Databricks
Po aprowizacji obszaru roboczego usługi Azure Databricks możesz użyć interfejsu użytkownika obszaru roboczego do pracy z danymi i zasobami obliczeniowymi. Interfejs użytkownika obszaru roboczego to internetowy interfejs użytkownika, w którym można tworzyć zasoby obszaru roboczego, takie jak klastry Spark i zarządzać nimi, oraz używać notesów i zapytań do pracy z danymi w plikach i tabelach.
Strona główna zawiera skróty do typowych zadań i obiektów obszaru roboczego, które ułatwiają rozpoczęcie pracy. Możesz zaimportować dane, utworzyć notatnik, utworzyć zapytanie i skonfigurować eksperyment AutoML.
Pasek boczny zawiera typowe kategorie usługi Databricks (Obszar roboczy, Ostatnie, Wykaz, Zadania i potoki, Obliczenia, Marketplace). Następnie jest podzielony według obszaru produktu:
- SQL: Edytor SQL, Zapytania, Pulpity nawigacyjne, Genie, Alerty, Historia zapytań, SQL Warehouse
- Inżynieria danych: wykonania zadań, pozyskiwanie danych
- Uczenie maszynowe: plac zabaw, eksperymenty, funkcje, modele, obsługa
Wybierz + Nowy aby:
- Twórz obiekty obszaru roboczego, takie jak notesy, zapytania, repozytoria, pulpity nawigacyjne, alerty, zadania, potoki, eksperymenty, modele i punkty końcowe obsługi.
- Tworzenie zasobów obliczeniowych , takich jak klastry, magazyny SQL i punkty końcowe uczenia maszynowego.
Użyj górnego paska, aby wyszukać obiekty obszaru roboczego, takie jak notesy, zapytania, pulpity nawigacyjne, alerty, pliki, foldery, biblioteki, tabele zarejestrowane w Unity Catalog, zadania i repozytoria w jednym centralnym miejscu. Na pasku wyszukiwania można również uzyskać dostęp do ostatnio wyświetlanych obiektów.
Obszar roboczy jest dostępny w wielu językach. Aby zmienić język obszaru roboczego, wybierz swoją nazwę użytkownika na górnym pasku nawigacyjnym, wybierz pozycję Ustawienia i przejdź do karty Preferencje .
Uzyskiwanie pomocy od asystenta usługi Databricks
Databricks Assistant to programista programujący w parach i narzędzie wsparcia oparte na sztucznej inteligencji, które pomaga wydajniej pracować w środowisku Databricks, generując, wyjaśniając i naprawiając kod lub zapytania bezpośrednio w notatnikach, pulpitach nawigacyjnych i plikach.
Może ona pomóc w wielu zadaniach, w tym identyfikowaniu i poprawianiu błędów, tworzeniu wizualizacji danych, diagnozowaniu problemów z zadaniami oraz filtrowaniu lub analizowaniu danych przy użyciu monitów języka naturalnego. Asystent może wyświetlić odpowiednie wskazówki z dokumentacji Azure Databricks.
Dzięki użyciu metadanych Unity Catalog, personalizuje odpowiedzi na podstawie zasobów danych w waszej organizacji — tabel, kolumn i opisów — co ułatwia eksplorację i pracę z danymi.