Inżynieria danych usługi Databricks

Funkcje inżynierii danych usługi Databricks to niezawodne środowisko współpracy między analitykami danych, inżynierami danych i analitykami danych. Zadania inżynieryjne danych są również szkieletem rozwiązań uczenia maszynowego usługi Databricks.

Uwaga

Jeśli jesteś analitykiem danych, który współpracuje głównie z zapytaniami SQL i narzędziami analizy biznesowej, możesz preferować usługę Databricks SQL.

Nazwisko Użyj tej opcji, gdy chcesz...
Tabele na żywo delty Dowiedz się, jak tworzyć potoki danych na potrzeby pozyskiwania i przekształcania przy użyciu tabel delta live usługi Databricks.
Przesyłanie strumieniowe ze strukturą Dowiedz się więcej na temat przesyłania strumieniowego, przyrostowych i obciążeń w czasie rzeczywistym obsługiwanych przez przesyłanie strumieniowe ze strukturą w usłudze Databricks.
Apache Spark Dowiedz się, jak działa platforma Apache Spark na platformie Databricks i databricks.
Środowisko obliczeniowe Dowiedz się więcej o klastrach usługi Databricks i sposobie ich tworzenia i zarządzania nimi.
Notesy Dowiedz się, czym jest notes usługi Databricks oraz jak używać notesów do przetwarzania, analizowania i wizualizowania danych oraz zarządzania nimi.
Przepływy pracy Dowiedz się, jak organizować przepływy pracy przetwarzania danych, uczenia maszynowego i analizy danych na platformie Databricks.
Biblioteki Dowiedz się, jak udostępnić kod innej firmy lub niestandardowy w usłudze Databricks przy użyciu bibliotek. Dowiedz się więcej o różnych trybach instalowania bibliotek w usłudze Databricks.
Foldery Git Dowiedz się, jak używać usługi Git do kontrolowania wersji notesów i innych plików na potrzeby programowania w usłudze Databricks.
DBFS Dowiedz się więcej o systemie plików usługi Databricks (DBFS), rozproszonym systemie plików zainstalowanym w obszarze roboczym usługi Databricks i dostępnym w klastrach usługi Databricks
Pliki Dowiedz się więcej o opcjach pracy z plikami w usłudze Databricks.
Migracja Dowiedz się, jak migrować aplikacje danych, takie jak zadania ETL, magazyny danych przedsiębiorstwa, uczenie maszynowe, nauka o danych i analiza danych do usługi Databricks.
Optymalizacja i wydajność Dowiedz się więcej na temat optymalizacji i zaleceń dotyczących wydajności w usłudze Databricks.