Databricks-Datentechnik
Databricks-Datentechnikfunktionen sind eine stabile Umgebung für die Zusammenarbeit zwischen wissenschaftliche Fachkräften für Daten, technischen Fachkräften für Daten und Datenanalysten. Datentechnikaufgaben sind auch das Rückgrat von Databricks-Lösungen für maschinelles Lernen.
Hinweis
Wenn Sie ein Datenanalyst sind, der hauptsächlich mit SQL-Abfragen und BI-Tools arbeitet, bevorzugen Sie möglicherweise Databricks SQL.
Name | Verwenden Sie dies, wenn Sie möchten … |
---|---|
Delta Live Tables | Erfahren Sie, wie Sie Datenpipelines für die Erfassung und Transformation mit Databricks Delta Live Tables erstellen. |
Strukturiertes Streaming | Erfahren Sie mehr über Streaming-, inkrementelle und Echtzeitworkloads, die durch strukturiertes Streaming in Databricks unterstützt werden. |
Apache Spark | Erfahren Sie, wie Apache Spark in Databricks und der Databricks Lakehouse-Plattform funktioniert. |
Runtimes | Erfahren Sie mehr über die verschiedenen Databricks Runtimes und Runtime-Inhalte. |
Cluster | Erfahren Sie mehr über Databricks-Cluster und wie Sie sie erstellen und verwalten. |
Notebooks | Hier erfahren Sie, was ein Databricks-Notebook ist und wie Sie Notebooks verwenden und verwalten, um Ihre Daten zu verarbeiten, zu analysieren und zu visualisieren. |
Workflows | Erfahren Sie, wie Sie Datenverarbeitungs-, Machine Learning- und Datenanalyseworkflows auf der Databricks Lakehouse-Plattform orchestrieren. |
Speicher | Erfahren Sie, wie Databricks Cloudobjektspeicher und Blockspeichervolumes als beständigen und kurzlebigen Datenspeicher verwendet. |
Libraries | Erfahren Sie, wie Sie Code von Drittanbietern oder benutzerdefinierten Code in Databricks mithilfe von Bibliotheken verfügbar machen. Erfahren Sie mehr über die verschiedenen Modi zum Installieren von Bibliotheken in Databricks. |
Repos | Erfahren Sie, wie Sie Git für die Versionskontrolle Ihrer Notebooks und anderer Dateien verwenden und zur Entwicklung in Databricks nutzen. |
DBFS | Erfahren Sie mehr über das Databricks-Dateisystem (Databricks File System, DBFS), ein verteiltes Dateisystem, das in einen Databricks-Arbeitsbereich eingebunden und in Databricks-Clustern verfügbar ist. |
Dateien | Erfahren Sie mehr über Optionen für die Arbeit mit Dateien in Databricks. |
Migration | Hier erfahren Sie, wie Sie Datenanwendungen wie ETL-Aufträge, Enterprise Data Warehouses, Machine Learning, Data Science und Analysen zu Databricks migrieren. |
Optimierung und Leistung | Erfahren Sie mehr über Optimierungen und Leistungsempfehlungen für Databricks. |