Uwaga
Dostęp do tej strony wymaga autoryzacji. Może spróbować zalogować się lub zmienić katalogi.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Obliczanie w usłudze Azure Databricks odnosi się do wyboru zasobów obliczeniowych dostępnych w obszarze roboczym Azure Databricks. Użytkownicy potrzebują dostępu do mocy obliczeniowej, aby uruchamiać obciążenia inżynierii danych, nauki o danych i analizy danych, takie jak produkcyjne przetwarzanie ETL, analiza strumieniowa, analiza ad hoc i uczenie maszynowe.
Użytkownicy mogą łączyć się z istniejącymi obliczeniami lub tworzyć nowe zasoby obliczeniowe, jeśli mają odpowiednie uprawnienia.
Możesz wyświetlić zasoby obliczeniowe, do których masz dostęp, korzystając z sekcji Obliczenia w obszarze roboczym:
Typy obliczeń
Są to typy zasobów obliczeniowych dostępnych w usłudze Azure Databricks:
- bezserwerowe zasoby obliczeniowe dla notatników: skalowalne zasoby obliczeniowe używane do wykonywania kodu SQL i Python w notatnikach.
- Bezserwerowe obliczenia dla zadań: skalowalne zasoby obliczeniowe używane do uruchamiania zadań lakeflow bez konfigurowania i wdrażania infrastruktury.
- Obliczenia ogólnego przeznaczenia: aprovisionowane zasoby obliczeniowe używane do analizowania danych w notatnikach. Możesz utworzyć, zakończyć i ponownie uruchomić to środowisko obliczeniowe przy użyciu interfejsu użytkownika, interfejsu wiersza polecenia lub interfejsu API REST.
- Zasoby obliczeniowe zadań: Zarezerwowane zasoby obliczeniowe używane do uruchamiania zautomatyzowanych zadań. Harmonogram zadań usługi Azure Databricks automatycznie tworzy zasób obliczeniowy dla zadania za każdym razem, gdy zadanie jest skonfigurowane do uruchamiania na nowych zasobach obliczeniowych. Obliczenia kończą się po zakończeniu zadania. Nie można ponownie uruchomić obliczeń zadania. Zobacz Konfigurowanie obliczeń dla zadań.
- Pule wystąpień: obliczenia z bezczynnymi, gotowymi do użycia wystąpieniami służącymi do skrócenia czasu uruchamiania i skalowania automatycznego. To środowisko obliczeniowe można utworzyć przy użyciu interfejsu użytkownika, interfejsu wiersza polecenia lub interfejsu API REST.
- Bezserwerowe magazyny SQL: elastyczne zasoby obliczeniowe na żądanie używane do uruchamiania poleceń SQL na obiektach danych w edytorze SQL lub w interaktywnych notatnikach. Magazyny SQL można tworzyć przy użyciu interfejsu użytkownika, interfejsu wiersza polecenia lub interfejsu API REST.
- Magazyny klasyczne SQL: służą do uruchamiania poleceń SQL na obiektach danych w edytorze SQL lub notesach interaktywnych. Magazyny SQL można tworzyć przy użyciu interfejsu użytkownika, interfejsu wiersza polecenia lub interfejsu API REST.
W artykułach w tej sekcji opisano sposób pracy z zasobami obliczeniowymi przy użyciu interfejsu użytkownika usługi Azure Databricks. Aby zapoznać się z innymi metodami, zobacz Co to jest CLI Databricks? oraz odniesienie do API REST Databricks.
Środowisko uruchomieniowe Databricks
Środowisko Databricks Runtime to zestaw podstawowych składników uruchamianych na obliczeniach. Środowisko Databricks Runtime to konfigurowalne ustawienie we wszystkich zadaniach obliczeniowych, ale wybierane automatycznie w magazynach SQL.
Każda wersja środowiska Databricks Runtime zawiera aktualizacje, które zwiększają użyteczność, wydajność i bezpieczeństwo analizy danych big data. Środowisko Databricks Runtime na Twoim komputerze dodaje wiele funkcji, w tym:
- Delta Lake, warstwa magazynowa nowej generacji oparta na Apache Spark, która zapewnia transakcje ACID, zoptymalizowane układy i indeksy oraz ulepszenia silnika wykonawczego dla tworzenia potoków danych. Zobacz Co to jest usługa Delta Lake w usłudze Azure Databricks?.
- Zainstalowane biblioteki Java, Scala, Python i R.
- Ubuntu i towarzyszące mu biblioteki systemowe.
- Biblioteki GPU dla klastrów z obsługą GPU.
- Usługi Azure Databricks, które integrują się z innymi składnikami platformy, takimi jak notesy, zadania i zarządzanie klastrami.
Aby uzyskać informacje o zawartości każdej wersji środowiska uruchomieniowego, zobacz uwagi do wersji.
Wersjonowanie środowiska uruchomieniowego
Wersje środowiska Databricks Runtime są regularnie wydawane:
- Wersje wsparcia długoterminowego są reprezentowane przez kwalifikator LTS (na przykład 3,5 LTS). Dla każdej wersji głównej deklarujemy "kanoniczną" wersję funkcji, dla której zapewniamy trzy pełne lata pomocy technicznej. Aby uzyskać więcej informacji, zobacz Cykle życia wsparcia usługi Databricks.
- Wersje główne są reprezentowane przez przyrost do numeru wersji, który poprzedza punkt dziesiętny (na przykład skok z 3,5 do 4,0). Są one zwalniane, gdy występują poważne zmiany, z których niektóre mogą nie być zgodne z poprzednimi wersjami.
- Wersje funkcji są reprezentowane przez przyrost do numeru wersji, który następuje po przecinku dziesiętnym (na przykład skok z 3.4 do 3.5). Każda główna wersja zawiera wiele wersji funkcji. Wydania funkcjonalne są zawsze zgodne z poprzednimi wydaniami w ramach wersji głównej.