Sdílet prostřednictvím


Osvědčené postupy pro výpočetní prostředí bez serveru

Tento článek obsahuje doporučení osvědčených postupů pro používání bezserverových výpočetních prostředků v poznámkových blocích a úlohách.

Podle těchto doporučení zvýšíte produktivitu, nákladovou efektivitu a spolehlivost úloh v Azure Databricks.

Migrace úloh na bezserverové výpočetní prostředky

K ochraně izolace uživatelského kódu využívá bezserverové výpočetní prostředí zabezpečený režim sdíleného přístupu Azure Databricks. Z tohoto důvodu budou některé úlohy vyžadovat změny kódu, aby pokračovaly v práci na bezserverových výpočetních prostředcích. Seznam nepodporovaných funkcí najdete v tématu Omezení bezserverového výpočetního prostředí.

Migrace některých úloh je jednodušší než jiná. Úlohy, které splňují následující požadavky, budou nejjednodušší migrovat:

  • Data, ke které se přistupuje, musí být uložená v katalogu Unity.
  • Úloha by měla být kompatibilní s výpočetním režimem sdíleného přístupu.
  • Úloha by měla být kompatibilní s Modulem Databricks Runtime 14.3 nebo novějším.

Pokud chcete otestovat, jestli bude úloha fungovat na bezserverových výpočetních prostředcích bez serveru s režimem sdíleného přístupu a modulem Databricks Runtime verze 14.3 nebo novějším. Pokud je spuštění úspěšné, úloha je připravená k migraci.

Vzhledem k významu této změny a aktuálního seznamu omezení se mnoho úloh bez problémů nemigruje. Místo překódování všeho azure Databricks doporučuje při vytváření nových úloh určit prioritu kompatibility bezserverových výpočetních prostředků.

Příjem dat z externích systémů

Vzhledem k tomu, že výpočetní prostředí bez serveru nepodporuje instalaci souborů JAR, nemůžete k příjmu dat z externího zdroje dat použít ovladač JDBC ani ODBC.

Mezi alternativní strategie, které můžete použít k příjmu dat, patří:

Alternativy příjmu dat

Při použití bezserverového výpočetního prostředí můžete k dotazování dat použít také následující funkce, aniž byste je přesunuli.

  • Pokud chcete omezit duplikaci dat nebo zaručit, že se dotazujete na nejnovější možná data, doporučuje Databricks používat funkci Delta Sharing. Podívejte se, co je rozdílové sdílení?
  • Pokud chcete provádět ad hoc vytváření sestav a testování konceptu, databricks doporučuje vyzkoušet správnou volbu, což může být Lakehouse Federation. Federace Lakehouse umožňuje synchronizaci celých databází s Azure Databricks z externích systémů a řídí se katalogem Unity. Podívejte se , co je Federace Lakehouse?.

Zkuste jednu nebo obě tyto funkce a zjistěte, jestli vyhovují vašim požadavkům na výkon dotazů.

Monitorování nákladů na výpočetní prostředky bez serveru

K monitorování nákladů na výpočetní prostředky bez serveru můžete použít několik funkcí: