Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
В этом разделе содержатся справочные материалы и инструкции для разработчиков конвейеров.
Загрузка и преобразование данных реализуются в конвейерах с помощью запросов, определяющих потоковые таблицы и материализованные представления. Для реализации этих запросов декларативные конвейеры Lakeflow Spark поддерживают интерфейсы SQL и Python. Так как эти интерфейсы обеспечивают эквивалентную функциональность для большинства вариантов использования данных, разработчики конвейеров могут выбрать интерфейс, с которым они наиболее удобны.
разработка Python
Создание конвейеров с помощью кода Python.
| Тема | Description |
|---|---|
| Разработайте код пайплайна с использованием Python. | Обзор разработки конвейеров в Python. |
| Lakeflow Spark Декларативные конвейеры на языке Python | Справочная документация Python по модулю pipelines. |
| Управление зависимостями Python для пайплайнов | Инструкции по управлению библиотеками Python в конвейерах. |
| Импортируйте модули Python из папок Git или файлов рабочей области | Инструкции по использованию модулей Python, хранящихся в Azure Databricks. |
Разработка SQL
Создание конвейеров с помощью кода SQL.
| Тема | Description |
|---|---|
| Разработка кода декларативного конвейера Spark Lakeflow с помощью SQL | Обзор разработки конвейеров в SQL. |
| Справочник по языку конвейера SQL | Справочная документация по синтаксису SQL для декларативных конвейеров Spark Lakeflow. |
| Использование конвейеров в Databricks SQL | Используйте Databricks SQL для работы с конвейерами. |
Другие темы разработки
В следующих темах описаны другие способы разработки конвейеров.
| Тема | Description |
|---|---|
| Преобразование конвейера в проект пакета | Преобразуйте существующий конвейер в пакет, который позволяет управлять конфигурацией обработки данных в управляемом источником YAML-файле для упрощения обслуживания и автоматического развертывания в целевых средах. |
| Метапрограммирование с помощью декларативных конвейеров Lakeflow Spark |
Создание конвейеров с помощью dlt-meta. Используйте библиотеку open source dlt-meta для автоматизации создания конвейеров с помощью платформы, управляемой метаданными.Руководство. Создание нескольких потоков с разными параметрами. Создайте несколько потоков в цикле в Python. |
| Разработка кода конвейера в локальной среде разработки | Общие сведения о вариантах разработки конвейеров локально. |