Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Questo articolo mira a fornire indicazioni chiare e autorevoli per la pianificazione della produzione. L'uso delle procedure consigliate consente di ridurre i costi, migliorare le prestazioni e rafforzare la sicurezza.
Procedure consigliate | Impatto | Documenti |
---|---|---|
Usare cluster di processi per flussi di lavoro automatizzati | Costo: I cluster di job vengono fatturati a tariffe inferiori rispetto ai cluster interattivi. | |
Riavviare i cluster a lungo termine | Sicurezza: riavviare i cluster per sfruttare le patch e le correzioni di bug in Databricks Runtime. | |
Usare i principali di servizio anziché gli account utente per eseguire processi di produzione | Sicurezza: se i processi sono di proprietà di singoli utenti, quando gli utenti lasciano l'organizzazione, questi processi potrebbero interrompere l'esecuzione. | |
Usare i Lakeflow Jobs per l'orchestrazione quando possibile | Costo: non è necessario usare strumenti esterni per orchestrare se si orchestrano solo i carichi di lavoro in Azure Databricks. | |
Usare la versione LTS più recente di Databricks Runtime | Prestazioni e costi: Azure Databricks migliora sempre Databricks Runtime per l'usabilità, le prestazioni e la sicurezza. | |
Non archiviare i dati di produzione nella radice DBFS | Sicurezza: quando i dati vengono archiviati nella radice DBFS, tutti gli utenti possono accedervi. |