Osvědčené postupy pro výpočetní prostředí bez serveru
Tento článek obsahuje doporučení osvědčených postupů pro používání bezserverových výpočetních prostředků v poznámkových blocích a úlohách.
Podle těchto doporučení zvýšíte produktivitu, nákladovou efektivitu a spolehlivost úloh v Azure Databricks.
Migrace úloh na bezserverové výpočetní prostředky
K ochraně izolace uživatelského kódu využívá bezserverové výpočetní prostředí zabezpečený režim sdíleného přístupu Azure Databricks. Z tohoto důvodu budou některé úlohy vyžadovat změny kódu, aby pokračovaly v práci na bezserverových výpočetních prostředcích. Seznam nepodporovaných funkcí najdete v tématu Omezení bezserverového výpočetního prostředí.
Migrace některých úloh je jednodušší než jiná. Úlohy, které splňují následující požadavky, budou nejjednodušší migrovat:
- Data, ke které se přistupuje, musí být uložená v katalogu Unity.
- Úloha by měla být kompatibilní s výpočetním režimem sdíleného přístupu.
- Úloha by měla být kompatibilní s Modulem Databricks Runtime 14.3 nebo novějším.
Pokud chcete otestovat, jestli bude úloha fungovat na bezserverových výpočetních prostředcích bez serveru s režimem sdíleného přístupu a modulem Databricks Runtime verze 14.3 nebo novějším. Pokud je spuštění úspěšné, úloha je připravená k migraci.
Vzhledem k významu této změny a aktuálního seznamu omezení se mnoho úloh bez problémů nemigruje. Místo překódování všeho azure Databricks doporučuje při vytváření nových úloh určit prioritu kompatibility bezserverových výpočetních prostředků.
Příjem dat z externích systémů
Vzhledem k tomu, že výpočetní prostředí bez serveru nepodporuje instalaci souborů JAR, nemůžete k příjmu dat z externího zdroje dat použít ovladač JDBC ani ODBC.
Mezi alternativní strategie, které můžete použít k příjmu dat, patří:
Stavební bloky založené na SQL, jako je COPY INTO a streamované tabulky.
Automatický zavaděč pro přírůstkové a efektivní zpracování nových datových souborů při jejich doručení do cloudového úložiště. Podívejte se, co je automatický zavaděč?
Partnerová řešení pro příjem dat Viz Připojení k partnerům pro příjem dat pomocí Partnerského připojení.
Uživatelské rozhraní pro přidání dat pro přímé nahrání souborů. Viz Nahrání souborů do Azure Databricks.
Alternativy příjmu dat
Při použití bezserverového výpočetního prostředí můžete k dotazování dat použít také následující funkce, aniž byste je přesunuli.
- Pokud chcete omezit duplikaci dat nebo zaručit, že se dotazujete na nejnovější možná data, doporučuje Databricks používat funkci Delta Sharing. Podívejte se, co je rozdílové sdílení?
- Pokud chcete provádět ad hoc vytváření sestav a testování konceptu, databricks doporučuje vyzkoušet správnou volbu, což může být Lakehouse Federation. Federace Lakehouse umožňuje synchronizaci celých databází s Azure Databricks z externích systémů a řídí se katalogem Unity. Podívejte se , co je Federace Lakehouse?.
Zkuste jednu nebo obě tyto funkce a zjistěte, jestli vyhovují vašim požadavkům na výkon dotazů.
Monitorování nákladů na výpočetní prostředky bez serveru
K monitorování nákladů na výpočetní prostředky bez serveru můžete použít několik funkcí:
Pomocí systémových tabulek můžete vytvářet řídicí panely, nastavovat výstrahy a provádět ad hoc dotazy. Viz Monitorování nákladů na výpočetní prostředky bez serveru.
Nastavte upozornění rozpočtu ve vašem účtu. Viz Použití rozpočtů k monitorování útraty účtu.
Importujte předem nakonfigurovaný řídicí panel využití. Viz Import řídicího panelu využití.