Сравнение продуктов и технологий машинного обучения Майкрософт

Узнайте о продуктах и технологиях машинного обучения Майкрософт. Сравните варианты для эффективной сборки, развертывания и администрирования решений машинного обучения.

Продукты машинного обучения на основе облака

Для машинного обучения в облаке доступны следующие решения.

Варианты облака Что это Возможности
Машинное обучение Azure Управляемая платформа для машинного обучения Использование предварительно обученной модели. Или обучение, развертывание моделей и управление ими в Azure с помощью Python и CLI.
Azure Cognitive Services Предварительно созданные возможности AI, реализованные с помощью API-интерфейсов и пакетов SDK. Быстрое создание интеллектуальных приложений с использованием стандартных языков программирования. Опыт в сфере машинного обучения и обработки и анализа данных не требуется.
Службы машинного обучения в Управляемом экземпляре SQL Azure Машинное обучение для баз данных в SQL Обучение и развертывание моделей в Управляемом экземпляре SQL Azure
Машинное обучение в Azure Synapse Analytics Служба аналитики с машинным обучением Обучение и развертывание моделей в Azure Synapse Analytics
Машинное обучение и ИИ с помощью ONNX в Azure SQL Edge Машинное обучение в SQL в Интернете вещей Обучение и развертывание моделей в SQL Azure для пограничных вычислений
Azure Databricks Платформа аналитики на основе Apache Spark Создание и развертывание моделей и рабочих процессов данных с помощью интеграции с библиотеками машинного обучения с открытым исходным кодом и платформой MLflow .

Продукты машинного обучения в локальной среде

Для машинного обучения в локальной среде доступны следующие решения. Локальные серверы также можно запустить на виртуальной машине в облаке.

Варианты локальных решений Что это Возможности
Службы машинного обучения SQL Server Машинное обучение для баз данных в SQL Обучение и развертывание моделей внутри SQL Server
Службы машинного обучения в Кластерах больших данных SQL Server Машинное обучение в Кластерах больших данных Обучение и развертывание моделей в Кластерах больших данных SQL Server

Платформы и средства разработки

Для машинного обучения доступны следующие платформы и средства разработки.

Платформы и средства Что это Возможности
Виртуальная машина для обработки и анализа данных Azure Виртуальная машина с предустановленными средствами для обработки и анализа данных Разработка решений машинного обучения в предварительно настроенной среде
ML.NET Кроссплатформенный пакет SDK для машинного обучения с открытым исходным кодом Разработка решений машинного обучения для приложений .NET
Машинное обучение Windows Платформа машинного обучения Windows 10 Оценка обученных моделей на устройстве под управлением Windows 10
SynapseML Основанная на исходном коде распределенная платформа машинного обучения и микрослужб для Apache Spark Создание и развертывание масштабируемых приложений машинного обучения для Scala и Python.
Расширение Машинного обучения для Azure Data Studio Основанное на открытом исходном коде кроссплатформенное расширение машинного обучения для Azure Data Studio Управление пакетами, импорт моделей машинного обучения, создание прогнозов и создание записных книжек для выполнения экспериментов для баз данных SQL

Машинное обучение Azure

Машинное обучение Azure — это полностью управляемая облачная служба, используемая для обучения, развертывания и управления моделями машинного обучения в большом масштабе. Она полностью поддерживает технологии с открытым исходным кодом, позволяя использовать десятки тысяч пакетов Python c открытым исходным кодом, таких как TensorFlow, PyTorch и scikit-learn. Кроме того, доступны полнофункциональные средства, такие как вычислительные экземпляры, записные книжки Jupyter или расширение Машинного обучения Azure для Visual Studio Code — бесплатное расширение для управления ресурсами, рабочими процессами обучения модели и развертываниями в Visual Studio Code. Машинное обучение Azure включает в себя компоненты, которые с легкостью эффективно и точно автоматизируют создание и настройку моделей.

Используйте пакет SDK для Python, записные книжки Jupyter, R и CLI для машинного обучения в масштабе облака. Для варианта с написанием небольшого объема кода или без кода вообще используйте интерактивный конструктор Машинного обучения Azure в студии, чтобы легко и быстро создавать, тестировать и развертывать модели с помощью предварительно созданных алгоритмов машинного обучения.

Попробуйте Машинное обучение Azure бесплатно.

Позиция Описание
Тип Решение машинного обучения на основе облака
Поддерживаемые языки Python, R
Этапы машинного обучения Обучение модели
Развертывание
MLOps и управление
Основные преимущества Сначала код (SDK) и студии и параметры разработки веб-интерфейса конструктора перетаскивания.

Централизованное управление скриптами и журналом выполнения, что упрощает сравнение версий модели.

Простое развертывание моделей и управление ими в облаке или на граничных устройствах.
Рекомендации Необходимо ознакомиться с моделью управления моделями.

Службы ИИ Azure

Службы искусственного интеллекта Azure — это набор предварительно созданных API, позволяющих создавать приложения, использующие естественные методы взаимодействия. Термин "предварительно созданные" подразумевает, что для обучения моделей добавлять наборы данных или применять знания в области обработки и анализа данных не требуется. Все это уже сделано и упаковано в виде API-интерфейсов и пакетов SDK, позволяющих приложениям видеть, слышать, говорить, понимать и интерпретировать потребности пользователей с помощью всего нескольких строк кода. В приложения можно легко добавить следующие интеллектуальные функции:

Используйте службы ИИ Azure для разработки приложений на разных устройствах и платформах. Эти API-интерфейсы постоянно совершенствуются и очень просто настраиваются.

Позиция Описание
Тип API-интерфейсы для создания интеллектуальных приложений
Поддерживаемые языки Различные варианты в зависимости от службы. Стандартными являются C#, Java, JavaScript и Python.
Этапы машинного обучения Развертывание
Основные преимущества Создание интеллектуальных приложений с использованием предварительно обученных моделей, доступные с помощью REST API и пакета SDK.
Разнообразные модели для естественных методов коммуникации со зрением, речью, языком и решением.
Опыт в сфере машинного обучения и обработки и анализа данных не требуется.

Машинное обучение SQL

Машинное обучение SQLпредоставляет возможности статистического анализа, визуализации данных и прогнозной аналитики на Python и R для реляционных данных как в локальной, так и в облачной среде. Ниже перечислены текущие платформы и средства.

Используйте машинное обучение SQL, если вам нужны встроенный ИИ и прогнозная аналитика для реляционных данных в SQL.

Позиция Описание
Тип Прогнозная аналитика для реляционных данных в локальной среде
Поддерживаемые языки Python, R, SQL
Этапы машинного обучения Подготовка данных
Обучение модели
Развертывание
Основные преимущества Возможность инкапсулирования прогнозной логики в функции базы данных, что позволяет легко включать ее в логику уровня данных.
Рекомендации Предполагается наличие базы данных SQL в качестве уровня данных в вашем приложении.

Виртуальная машина для обработки и анализа данных Azure

Виртуальная машина для обработки и анализа данных Azure — это настроенная среда виртуальной машины в облаке Microsoft Azure. Доступны версии для Windows и Linux Ubuntu. Среда создана специально для обработки и анализа данных и разработки решений машинного обучения. Она имеет множество популярных платформ обработки и анализа данных, платформ машинного обучения и других инструментов, предварительно установленных и предварительно настроенных для создания интеллектуальных приложений для расширенной аналитики.

Используйте виртуальную машину для обработки и анализа данных, когда нужно запускать или размещать задания на одном узле. Также с ее помощью можно удаленно увеличивать масштаб для обработки на одном компьютере.

Позиция Описание
Тип Настроенная среда виртуальной машины для обработки и анализа данных
Основные преимущества Сокращение времени на установку, управление и устранение неполадок в средствах и ​​платформах для обработки и анализа данных.

Включены последние версии всех широко используемых средств и ​​платформ.

Параметры виртуальной машины включают высокомасштабируемые изображения с возможностями графической обработки (GPU) для интенсивного моделирования данных.
Рекомендации К виртуальной машине невозможно получить доступ в автономном режиме.

За использование виртуальной машины взимается плата в Azure, поэтому следует следить за тем, чтобы она работала только при необходимости.

Azure Databricks

Azure Databricks — это платформа аналитики на основе Apache Spark, оптимизированная для облачной платформы Microsoft Azure. Databricks интегрируется с Azure, обеспечивая интерактивную рабочую область, простую настройку и упрощенные рабочие процессы. Эта рабочая область позволяет специалистам в области обработки и анализа данных, инжиниринга данных и бизнес-аналитики работать совместно. Используйте код Python, R, Scala и SQL в онлайновых записных книжках, чтобы запрашивать, визуализировать и моделировать данные.

Используйте Databricks для совместной работы над созданием решений для машинного обучения в Apache Spark.

Позиция Описание
Тип Платформа аналитики на основе Apache Spark
Поддерживаемые языки Python, R, Scala, SQL
Этапы машинного обучения Подготовка данных
Предварительная обработка данных
Обучение модели
Настройка модели
Вывод модели
Управление
Развертывание

ML.NET

ML.NET — это основанный на открытом исходном коде кроссплатформенный фреймворк машинного обучения. С помощью ML.NET можно создавать пользовательские решения машинного обучения и интегрировать их в приложения .NET. ML.NET предлагает различные уровни взаимодействия с популярными платформами, такими как TensorFlow и ONNX, для обучения и оценки моделей машинного обучения и глубокого обучения. Для выполнения ресурсоемких задач, таких как обучение моделей классификации изображений, можно воспользоваться преимуществами Azure для обучения моделей в облаке.

Используйте ML.NET, если вам нужно интегрировать решения для машинного обучения в приложения .NET. Выберите API для работы по модели code-first и Model Builder или CLI для написания небольшого объема кода.

Позиция Описание
Тип Кроссплатформенный фреймворк с открытым исходным кодом для разработки пользовательских приложений машинного обучения с помощью .NET
Поддерживаемые языки C#, F#
Этапы машинного обучения Подготовка данных
Обучение
Развертывание
Основные преимущества Интерфейс обработки и анализа данных и машинного обучения не требуется
Использование знакомых средств (Visual Studio, Microsoft Visual Studio Code) и языков
Развертывание в среде, где выполняется .NET
Расширяемый
Масштабируемость
Оценка в локальной среде

Машинное обучение Windows

Подсистема вывода машинного обучения Windows позволяет использовать обученные модели машинного обучения в приложениях, оценивая обученные модели локально на устройствах с Windows 10.

Используйте машинное обучение Windows, если вы хотите использовать обученные модели машинного обучения в приложениях Windows.

Позиция Описание
Тип Подсистема вывода для обученных моделей на устройствах Windows
Поддерживаемые языки C# или C++, JavaScript

SynapseML

SynapseML (ранее известный как MMLSpark) — это библиотека с открытым исходным кодом, которая упрощает создание конвейеров машинного обучения с массовым масштабированием. SynapseML предоставляет API для различных задач машинного обучения, таких как анализ текста, визуальное распознавание, обнаружение аномалий и многие другие. SynapseML основан на распределенной вычислительной платформе Apache Spark и использует тот же API, что и библиотека SparkML/MLLib, что позволяет легко внедрять модели SynapseML в существующие рабочие процессы Apache Spark.

SynapseML добавляет множество средств глубокого обучения и обработки и анализа данных в экосистему Spark, включая простую интеграцию конвейеров Spark Машинное обучение с light Gradient Boosting Machine (LightGBM), LIME (Интерпретация модели) и OpenCV. Эти средства можно использовать для создания эффективных прогнозных моделей в любом кластере Spark, например Azure Databricks или Cosmic Spark.

SynapseML также предоставляет сетевые возможности для экосистемы Spark. С помощью проекта HTTP в Spark пользователи могут внедрять любые веб-службы в свои модели SparkML. Кроме того, SynapseML предоставляет удобные средства для оркестрации служб ИИ Azure в большом масштабе. Для развертывания производственного уровня проект Spark Serving обеспечивает высокую пропускную способность и предоставляет веб-службы с задержкой длительностью меньше миллисекунды, поддерживаемые кластером Spark.

Позиция Описание
Тип Основанная на исходном коде распределенная платформа машинного обучения и микрослужб для Apache Spark
Поддерживаемые языки Scala 2.11, Java, Python 3.5 и более поздние версии, R (бета-версия)
Этапы машинного обучения Подготовка данных
Обучение модели
Развертывание
Основные преимущества Масштабируемость
Совместимость с потоковой передачей и обслуживанием
Отказоустойчивость
Рекомендации Требуется Apache Spark

Соавторы

Эта статья поддерживается корпорацией Майкрософт. Первоначально он был написан следующими участник.

Автор субъекта:

  • Zoiner Tejada | главный исполнительный директор (генеральный директор) и архитектор

Следующие шаги

  • Дополнительные сведения обо всех продуктах для разработки с использованием искусственного интеллекта (ИИ), предлагаемых корпорацией Майкрософт, см. здесь.
  • Учебные курсы по разработке решений ИИ и Машинное обучение с помощью Майкрософт см. в обучении Microsoft Learn.