Skonfiguruj potok bezserwerowy

Potoki bezserwerowe działają na zasobach obliczeniowych zarządzanych przez Azure Databricks, eliminując potrzebę większości konfiguracji infrastruktury.

Databricks zaleca opracowywanie nowych potoków z wykorzystaniem architektury bezserwerowej. Niektóre obciążenia mogą wymagać skonfigurowania klasycznego środowiska obliczeniowego lub pracy ze starszym magazynem metadanych Hive. Zobacz Konfigurowanie klasycznych zasobów obliczeniowych dla potoków i Używanie potoków Lakeflow ze starszym magazynem metadanych Hive.

Uwaga / Notatka

Bezserwerowe potoki zawsze używają Unity Catalogu. Zobacz Używanie Unity Catalogu z potokami.
Aby uzyskać informacje o ograniczeniach obliczeniowych bezserwerowych, zobacz Ograniczenia obliczeniowe bezserwerowe. Opisane tam ograniczenia wyzwalacza Structured Streaming nie mają zastosowania do trybów potoków. Potoki bezserwerowe obsługują tryby wyzwalane, ciągłe i w czasie rzeczywistym. Zobacz Tryb wyzwalany vs. ciągły tryb potokowy.
Nie można ręcznie dodać ustawień obliczeniowych w obiekcie clusters w konfiguracji JSON dla potoku bezserwerowego. Próba wykonania tej czynności powoduje wystąpienie błędu.

Jeśli musisz skorzystać z połączenia Azure Private Link w przypadku bezserwerowych potoków Lakeflow, skontaktuj się z przedstawicielem Databricks.

Requirements

Aby używać potoków bezserwerowych, obszar roboczy musi mieć włączony Unity Catalog.

Twoja przestrzeń robocza musi znajdować się w regionie obsługującym tryb bezserwerowy.

Zalecana konfiguracja dla potoków bezserwerowych

Ważne

Uprawnienia do tworzenia klastra nie są wymagane do konfigurowania potoków bezserwerowych. Domyślnie wszyscy użytkownicy obszaru roboczego mogą używać potoków bezserwerowych.

Potoki danych bezserwerowe usuwają większość opcji konfiguracji, ponieważ Azure Databricks zarządza całą infrastrukturą. Podczas tworzenia nowego potoku ustawieniem domyślnym jest użycie bezserwerowego. Aby dowiedzieć się, jak skonfigurować potok bezserwerowy, zobacz Konfigurowanie potoków.

Możesz również przekonwertować istniejące potoki skonfigurowane za pomocą Unity Catalog na bezserwerowe. Zobacz , aby skonwertować istniejący pipeline na serverless.

Inne zagadnienia dotyczące konfiguracji

Następujące opcje konfiguracji są również dostępne dla potoków bezserwerowych:

Możesz wybrać użycie trybu Continuous podczas uruchamiania potoków w środowisku produkcyjnym. Zobacz Tryb wyzwalany vs. ciągły tryb potokowy.
Dodaj Powiadomienia na potrzeby aktualizacji wiadomości e-mail na podstawie warunków powodzenia lub niepowodzenia. Zobacz Dodaj powiadomienia e-mail dotyczące wydarzeń w potoku.
Użyj pola Configuration, aby ustawić pary klucz-wartość dla tego strumienia. Te konfiguracje służą dwóm celom:
- Ustaw dowolne parametry, do których można odwoływać się w kodzie źródłowym. Zobacz Używanie parametrów z potokami.
- Skonfiguruj ustawienia pipeline i konfiguracje Spark. Zobacz Dokumentacja właściwości potoku.
Użyj kanału Preview, aby przetestować swój potok pod kątem oczekujących zmian środowiska uruchomieniowego i wypróbować nowe funkcje.
Zadeklaruj zależności zewnętrzne Python za pomocą ustawień środowiska potoku. Ręczne ponowne uruchomienie procesu Python (dbutils.library.restartPython()) nie jest obsługiwane, dlatego nie można zainstalować ani ponownie załadować zależności w czasie wykonywania. Zobacz Zarządzanie zależnościami języka Python dla potoków.

Zasady użycia bezserwerowego

Ważne

Ta funkcja jest dostępna w publicznej wersji testowej.

Zasady użycia bezserwerowego umożliwiają organizacji stosowanie tagów niestandardowych w przypadku użycia bezserwerowego na potrzeby szczegółowego przypisywania rozliczeń. Po zaznaczeniu pola wyboru Bezserwerowe zostanie wyświetlone ustawienie Zasady użycia, w którym można wybrać zasadę, którą chcesz zastosować do potoku. Tagi są dziedziczone z zasad użycia bezserwerowego i mogą być edytowane tylko przez administratorów obszaru roboczego.

Uwaga / Notatka

Po przypisaniu zasad użycia bezserwerowego, istniejące pipeline'y nie są automatycznie oznaczane twoją polityką. Jeśli chcesz dołączyć do nich politykę, musisz ręcznie zaktualizować istniejące potoki.

Aby uzyskać więcej informacji na temat zasad użycia bezserwerowych, zobacz Użycie atrybutów z zasadami użycia bezserwerowego.

Wybieranie trybu wydajności

W przypadku wyzwolonych potoków można wybrać bezserwerowy tryb wydajności obliczeniowej przy użyciu ustawienia Zoptymalizowane pod kątem wydajności w harmonogramie potoku. Gdy to ustawienie jest wyłączone, potok używa standardowego trybu wydajności. Standardowy tryb wydajności został zaprojektowany w celu zmniejszenia kosztów obciążeń, w których dopuszczalne jest nieco wyższe opóźnienie uruchamiania. Obciążenia bezserwerowe korzystające ze standardowego trybu wydajności zwykle rozpoczynają się w ciągu od czterech do sześciu minut po wyzwoleniu, w zależności od dostępności obliczeniowej i zoptymalizowanego planowania.

Po włączeniu optymalizacji wydajności potok jest zoptymalizowany pod kątem wydajności, co powoduje szybsze uruchamianie i wykonywanie obciążeń wrażliwych na czas.

Oba tryby używają tej samej jednostki SKU, ale standardowy tryb wydajności zużywa mniej jednostek DBU, odzwierciedlając niższe użycie zasobów obliczeniowych.

Uwaga / Notatka

Aby użyć standardowego trybu wydajności w potokach ciągłych, skontaktuj się z zespołem ds. kont usługi Databricks.

Właściwości potoku bezserwerowego

Oprócz uproszczenia konfiguracji potoki bezserwerowe charakteryzują się następującymi cechami:

odświeżanie przyrostowe dla zmaterializowanych widoków: aktualizacje zmaterializowanych widoków są odświeżane przyrostowo, gdy jest to możliwe. Odświeżanie przyrostowe ma takie same wyniki jak pełna ponowna kompilacja. Aktualizacja używa pełnego odświeżania, jeśli wyniki nie mogą być obliczane przyrostowo. Zobacz Odświeżanie przyrostowe, aby uzyskać zmaterializowane widoki.

Przetwarzanie w potokach: aby zwiększyć wykorzystanie, przepływność i zmniejszyć opóźnienie dla obciążeń danych przesyłanych strumieniowo, takich jak pozyskiwanie danych, mikroparte są przetwarzane w potoku. Innymi słowy, zamiast uruchamiać mikropartie sekwencyjnie, jak w standardowym Spark Structured Streaming, bezserwerowe potoki Lakeflow uruchamiają mikropartie współbieżnie, poprawiając wykorzystanie zasobów obliczeniowych. Pipelining strumieni jest domyślnie włączone w linii bezserwerowych.
Pionowe skalowanie automatyczne: bezserwerowe potoki Lakeflow dodają do poziomego skalowania automatycznego zapewnianego przez ulepszone skalowanie automatyczne Databricks automatyczne przydzielanie najbardziej opłacalnych typów instancji, na których potok może działać bez awarii spowodowanych błędami braku pamięci. Zobacz Co to jest skalowanie automatyczne w pionie?

Przekształcanie istniejącego przepływu pracy, aby używał architektury bezserwerowej

Istniejące potoki skonfigurowane w ramach Unity Catalog można przekonwertować na potoki bezserwerowe. Wykonaj następujące kroki:

Na pasku bocznym obszaru roboczego Azure Databricks kliknij pozycję Zadania i Potoki.
Kliknij Nazwę potoku.
Kliknij przycisk Ustawienia.
Na prawym pasku bocznym w obszarze Obliczenia kliknij
Zaznacz pole wyboru obok Serwerless.
Kliknij przycisk Zapisz.

Ważne

Po włączeniu trybu bezserwerowego wszystkie skonfigurowane ustawienia obliczeniowe dla potoku zostaną usunięte. Jeśli przełączysz potok z powrotem na aktualizacje niebezserwerowe, musisz ponownie skonfigurować żądane ustawienia obliczeniowe w konfiguracji potoku.

Sprawdź zużycie DBU przez potok bezserwerowy

Zużycie DBU bezserwerowych potoków Lakeflow można sprawdzić, wykonując zapytanie do tabeli rozliczeniowego użycia, która jest częścią tabel systemowych Azure Databricks. Zobacz Jakie jest zużycie DBU potoku bezserwerowego?.

Opinia

Czy ta strona była pomocna?

Last updated on 2026-07-10

Skonfiguruj potok bezserwerowy

Requirements

Zalecana konfiguracja dla potoków bezserwerowych

Inne zagadnienia dotyczące konfiguracji

Zasady użycia bezserwerowego

Wybieranie trybu wydajności

Właściwości potoku bezserwerowego

Przekształcanie istniejącego przepływu pracy, aby używał architektury bezserwerowej

Sprawdź zużycie DBU przez potok bezserwerowy

Opinia

Dodatkowe zasoby