Поделиться через


Аппаратное ускорение для ИИ визуального распознавания Azure IoT Edge

Компьютерная графика и искусственный интеллект (ИИ) требуют больших вычислительных мощностей. Критически важным фактором при разработке проектов ИИ azure IoT Edge визуального распознавания является степень аппаратного ускорения, необходимого для решения.

Аппаратные ускорители, такие как графические процессоры (GPU), программируемые полевые вентильные массивы (ППВМ) и специализированные интегральные каналы (ASICs), являются экономичными способами повышения производительности.

Типы вычислительного оборудования

В следующих разделах описаны main типы вычислительного оборудования для компонентов IoT Edge визуального распознавания.

ЦП

Центральный процессор (ЦП) — это параметр по умолчанию для большинства вычислений общего назначения. ЦП может быть достаточно для рабочих нагрузок визуального распознавания, где время не является критическим. Однако для рабочих нагрузок, которые связаны с критическим временем, несколькими потоками камер или высокой частотой кадров, требуется определенное аппаратное ускорение.

Графический процессор

GPU — это процессор по умолчанию для высокопроизводительных компьютерных графических карт. Сценарии высокопроизводительных компьютеров (HPC), интеллектуальный анализ данных, а также рабочие нагрузки ИИ или машинного обучения (ML) используют GPU. Рабочие нагрузки визуального распознавания используют огромные возможности параллельных вычислений GPU для ускорения обработки данных в пикселях. Недостатком GPU является более высокое энергопотребление, что является критически важным фактором в пограничных рабочих нагрузках.

ППВМ

ППВМ — это мощные, перенастраивающиеся аппаратные ускорители, поддерживающие рост нейронных сетей глубокого обучения. Ускорители ППВМ имеют миллионы программируемых вентилей и сотни контактов ввода-вывода и могут выполнять триллионы операций умножения накопления (MAC) в секунду (TOPS). Существует множество библиотек ППВМ, оптимизированных для рабочих нагрузок визуального распознавания. Некоторые из этих библиотек включают предварительно настроенные интерфейсы для подключения к подчиненным камерам и устройствам.

Использование FGP в рабочих нагрузках машинного обучения и IoT Edge по-прежнему развивается. ППВМ, как правило, не хватает операций с плавающей запятой, но производители сделали улучшения в этой области.

ASIC

ASIC производятся для выполнения определенной задачи. ASIC, безусловно, являются самыми быстрыми доступными ускорителями, но являются наименее настраиваемыми. Микросхемы ASIC популярны из-за их небольшого размера, производительности на ватт и защиты интеллектуальной собственности (IP). IP-адрес сжигается в микросхемы ASIC, что затрудняет реконструирование собственных алгоритмов.

Соавторы

Эта статья поддерживается корпорацией Майкрософт. Первоначально она была написана следующими участниками.

Основной автор:

Чтобы просмотреть недоступные профили LinkedIn, войдите в LinkedIn.

Дальнейшие действия