Ingegneria dei dati di Databricks
Le funzionalità di progettazione dei dati di Databricks sono un ambiente affidabile per la collaborazione tra data scientist, data engineer e analisti dei dati. Le attività di ingegneria dei dati sono anche la spina dorsale delle soluzioni di Machine Learning di Databricks.
Nota
Se si è un analista di dati che lavora principalmente con query SQL e strumenti di business intelligence, è possibile preferire Databricks SQL.
Nome | Usa questa opzione quando vuoi... |
---|---|
Tabelle live delta | Informazioni su come creare pipeline di dati per l'inserimento e la trasformazione con tabelle live di Databricks Delta. |
Structured Streaming | Informazioni sui carichi di lavoro in streaming, incrementali e in tempo reale basati su Structured Streaming in Databricks. |
Apache Spark | Informazioni sul funzionamento di Apache Spark su Databricks e sulla piattaforma Databricks. |
Notebook | Informazioni su un notebook di Databricks e su come usare e gestire i notebook per elaborare, analizzare e visualizzare i dati. |
Flussi di lavoro | Informazioni su come orchestrare i flussi di lavoro di elaborazione dei dati, Machine Learning e analisi dei dati nella piattaforma Databricks. |
Raccolte | Informazioni su come rendere disponibile codice di terze parti o personalizzato in Databricks usando le librerie. Informazioni sulle diverse modalità di installazione delle librerie in Databricks. |
Cartelle Git | Informazioni su come usare Git per controllare la versione dei notebook e altri file per lo sviluppo in Databricks. |
DBFS | Informazioni su Databricks File System (DBFS), un file system distribuito montato in un'area di lavoro databricks e disponibile nei cluster Databricks |
File | Informazioni sulle opzioni per l'uso dei file in Databricks. |
Migrazione | Informazioni su come eseguire la migrazione di applicazioni dati come processi ETL, data warehouse aziendali, ML, data science e analisi in Databricks. |
Ottimizzazione e prestazioni | Informazioni sulle ottimizzazioni e le raccomandazioni sulle prestazioni in Databricks. |
Commenti e suggerimenti
https://aka.ms/ContentUserFeedback.
Presto disponibile: Nel corso del 2024 verranno gradualmente disattivati i problemi di GitHub come meccanismo di feedback per il contenuto e ciò verrà sostituito con un nuovo sistema di feedback. Per altre informazioni, vedereInvia e visualizza il feedback per