Изучение данных в базе данных зеркало с помощью записных книжек
Вы можете изучить данные, реплика полученные из зеркало базы данных с помощью запросов Spark в записных книжках.
Записные книжки — это мощный элемент кода для разработки заданий Apache Spark и экспериментов машинного обучения с данными. Записные книжки в Fabric Lakehouse можно использовать для изучения зеркало таблиц.
Необходимые компоненты
- Выполните инструкции по созданию зеркало зеркало базы данных из исходной базы данных.
Создание ярлыка
Сначала необходимо создать ярлык из зеркало таблиц в Lakehouse, а затем создать записные книжки с помощью запросов Spark в Lakehouse.
На портале Fabric откройте Инжиниринг данных.
Если у вас еще нет созданного Lakehouse, выберите Lakehouse и создайте новый Lakehouse , предоставив ему имя.
Выберите "Получить данные " -> Создать ярлык".
Выберите Microsoft OneLake.
Все зеркало базы данных можно просмотреть в рабочей области Fabric.
Выберите зеркало базу данных, которую вы хотите добавить в Lakehouse, в качестве ярлыка.
Выберите нужные таблицы из зеркало базы данных.
Нажмите кнопку "Далее" и "Создать".
В Обозреватель теперь можно просмотреть выбранные данные таблицы в Lakehouse.
Совет
Вы можете добавить другие данные в Lakehouse напрямую или использовать такие сочетания клавиш, как S3, ADLS 2-го поколения. Вы можете перейти к конечной точке аналитики SQL Lakehouse и объединить данные по всем этим источникам с зеркало данными без проблем.
Чтобы изучить эти данные в Spark, выберите точки рядом
...
с любой таблицей. Выберите "Создать записную книжку" или "Существующая записная книжка", чтобы начать анализ.Записная книжка автоматически открывается и загружает кадр данных с
SELECT ... LIMIT 1000
помощью запроса Spark SQL.