Руководство по переносу конвейеров глубокого обучения
Внимание
Поддержка этой документации прекращена, она может больше не обновляться. Продукты, службы или технологии, упомянутые в этом контенте, больше не поддерживаются. См . сведения об ИИ и машинном обучении в Databricks.
На этой странице приведены советы по переходу с пакета конвейеров глубокого обучения с открытым кодом, который входил в Databricks Runtime 6.6 ML и более ранних версий. Части библиотеки sparkdl
конвейеров глубокого обучения были удалены в Databricks Runtime 7.0 ML (EoS), в частности, преобразователи и оценки, используемые в конвейерах машинного обучения Apache Spark.
Эта страница не является источником общих сведений о конвейерах глубокого обучения в Azure Databricks.
Чтение образов
Пакет Конвейеров глубокого обучения включает средство чтения sparkdl.image.imageIO
изображений, которое было удалено в Databricks Runtime 7.0 ML (EoS).
Вместо него используйте источник данных изображений или источник данных двоичных файлов из Apache Spark. Многие из примеров записных книжек в load data for machine learning and deep learning показывают варианты использования этих двух источников данных.
Перенос обучения
Пакет конвейеров глубокого обучения включает в себя трансформатор машинного обучения Spark sparkdl.DeepImageFeaturizer
, который упрощает обучение с использованием моделей глубокого обучения. DeepImageFeaturizer
удален в Databricks Runtime 7.0 ML (EoS).
Вместо него для конструирования признаков с помощью моделей глубокого обучения применяйте пользовательские функции pandas. Пользовательские функции pandas и их новые разновидности, скалярные итераторы, реализуют более гибкие API-интерфейсы, поддерживают больше библиотек глубокого обучения и повышают производительность.
Примеры передачи обучения с помощью пользовательских функций pandas см. в разделе Конструирование признаков для передачи обучения.
Распределенная настройка гиперпараметров
Пакет конвейеров глубокого обучения включает оценщик машинного обучения Spark sparkdl.KerasImageFileEstimator
для настройки гиперпараметров с помощью служебных программ настройки Spark ML. KerasImageFileEstimator
удален в Databricks Runtime 7.0 ML (EoS).
Вместо этого используйте Hyperopt для распространения настройки гиперпараметров для моделей глубокого обучения.
Распределенный вывод
Пакет конвейеров глубокого обучения включает несколько преобразователей машинного обучения Spark для распространения вывода, все из которых были удалены в Databricks Runtime 7.0 ML (EoS):
DeepImagePredictor
TFImageTransformer
KerasImageFileTransformer
TFTransformer
KerasTransformer
Вместо этого используйте определяемые пользователем pandas UDF для выполнения вывода в Кадрах данных Spark, следуя примерам в примерах развертывания моделей для пакетного вывода и прогнозирования.
Развертывание моделей в качестве пользовательских функций SQL
Пакет конвейеров глубокого обучения включает служебную программу sparkdl.udf.keras_image_model.registerKerasImageUDF
для развертывания модели глубокого обучения в виде пользовательской функции, вызываемой из Spark SQL. registerKerasImageUDF
удален в Databricks Runtime 7.0 ML (EoS).
Вместо него используйте MLflow для экспорта модели в качестве пользовательской функции, как показано в примере в разделе Развертывание модели scikit-learn в Azure ML.