Ingegneria dei dati di Databricks

Le funzionalità di progettazione dei dati di Databricks sono un ambiente affidabile per la collaborazione tra data scientist, data engineer e analisti dei dati. Le attività di ingegneria dei dati sono anche la spina dorsale delle soluzioni di Machine Learning di Databricks.

Nota

Se si è un analista di dati che lavora principalmente con query SQL e strumenti di business intelligence, è possibile preferire Databricks SQL.

Nome Usa questa opzione quando vuoi...
Tabelle live delta Informazioni su come creare pipeline di dati per l'inserimento e la trasformazione con tabelle live di Databricks Delta.
Structured Streaming Informazioni sui carichi di lavoro in streaming, incrementali e in tempo reale basati su Structured Streaming in Databricks.
Apache Spark Informazioni sul funzionamento di Apache Spark su Databricks e sulla piattaforma Databricks.
Calcolo Informazioni sui cluster Databricks e su come crearli e gestirli.
Notebook Informazioni su un notebook di Databricks e su come usare e gestire i notebook per elaborare, analizzare e visualizzare i dati.
Flussi di lavoro Informazioni su come orchestrare i flussi di lavoro di elaborazione dei dati, Machine Learning e analisi dei dati nella piattaforma Databricks.
Raccolte Informazioni su come rendere disponibile codice di terze parti o personalizzato in Databricks usando le librerie. Informazioni sulle diverse modalità di installazione delle librerie in Databricks.
Cartelle Git Informazioni su come usare Git per controllare la versione dei notebook e altri file per lo sviluppo in Databricks.
DBFS Informazioni su Databricks File System (DBFS), un file system distribuito montato in un'area di lavoro databricks e disponibile nei cluster Databricks
File Informazioni sulle opzioni per l'uso dei file in Databricks.
Migrazione Informazioni su come eseguire la migrazione di applicazioni dati come processi ETL, data warehouse aziendali, ML, data science e analisi in Databricks.
Ottimizzazione e prestazioni Informazioni sulle ottimizzazioni e le raccomandazioni sulle prestazioni in Databricks.