Реализация решения Машинное обучение с помощью Azure Databricks

Средний уровень
Специалист по обработке и анализу данных
Azure Databricks

Azure Databricks — это облачная платформа для аналитики данных и машинного обучения. Специалисты по обработке и анализу данных и инженеры машинного обучения могут использовать Azure Databricks для реализации решений машинного обучения в большом масштабе.

Предварительные требования

В этой схеме обучения предполагается, что у вас есть опыт использования Python для изучения данных, а также обучения моделей машинного обучения с помощью популярных платформ с открытым кодом, таких как Scikit-Learn, PyTorch и TensorFlow. Прежде чем начинать эту схему обучения, рекомендуется пройти схему обучения Создание моделей машинного обучения.

Модули, включенные в эту схему обучения

Azure Databricks — это облачная служба, которая предоставляет масштабируемую платформу для аналитики данных с помощью Apache Spark.

Платформа Azure Databricks основана на Apache Spark и позволяет инженерам и аналитикам запускать задания Spark для преобразования, анализа и визуализации данных в большом масштабе.

Машинное обучение предполагает использование данных для обучения прогнозной модели. Azure Databricks поддерживает несколько часто используемых платформ машинного обучения, которые можно использовать для обучения моделей.

MLflow — это платформа открытый код для управления жизненным циклом машинного обучения, который изначально поддерживается в Azure Databricks.

Настройка гиперпараметров является важной частью машинного обучения. В Azure Databricks можно использовать библиотеку Hyperopt для автоматической оптимизации гиперпараметров.

AutoML в Azure Databricks упрощает процесс создания эффективной модели машинного обучения для данных.

Глубокое обучение использует нейронные сети для обучения высокоэффективных моделей машинного обучения для сложного прогнозирования, компьютерного зрения, обработки естественного языка и других рабочих нагрузок ИИ.