Q: Что такое CNTK?

CNTK , Microsoft Cognitive Toolkit, является платформой для глубокого обучения. Вычислительная сеть определяет функцию для обучения в виде направленного графа, где каждый конечный узел состоит из входного значения или параметра, а каждый неконечный узел представляет матрицу или операцию тензора на дочерних элементах. Красота CNTK заключается в том, что после описания вычислительной сети все вычисления, необходимые для изучения сетевых параметров, выполняются автоматически. Нет необходимости создавать градиенты аналитически или кодировать взаимодействия между переменными для обратного распространения.

Q: Как отправить отзыв?

Дайте нам отзыв через эти каналы .

Question 1

Что такое CNTK?

Accepted Answer

CNTK, Microsoft Cognitive Toolkit, является платформой для глубокого обучения. Вычислительная сеть определяет функцию для обучения в виде направленного графа, где каждый конечный узел состоит из входного значения или параметра, а каждый неконечный узел представляет матрицу или операцию тензора на дочерних элементах. Красота CNTK заключается в том, что после описания вычислительной сети все вычисления, необходимые для изучения сетевых параметров, выполняются автоматически. Нет необходимости создавать градиенты аналитически или кодировать взаимодействия между переменными для обратного распространения.

Question 2

Почему корпорация Майкрософт разработала CNTK?

Accepted Answer

Сначала мы создали CNTK для себя. CNTK был разработан для быстрого обучения по самым большим наборам данных. Многие критически важные службы Майкрософт работают на моделях, обученных с помощью CNTK. Результаты были настолько положительными, мы хотели поделиться нашим набором средств с миром.

Question 3

Как отправить отзыв?

Accepted Answer

Дайте нам отзыв через эти каналы.

Question 4

Обучение моделей глубокого обучения может быть трудоемким, может ли CNTK помочь с этим?

Accepted Answer

Для критически важных исследований ИИ мы считаем, что эффективность и производительность являются важными критериями. CNTK был разработан для пиковой производительности не только для процессоров, но и для сценариев с одним GPU, несколькими GPU и несколькими компьютерами с GPU. Кроме того, 1-разрядный метод сжатия (Майкрософт) или метод блокировки импульса значительно сокращает затраты на связь, что позволяет выполнять высокомасштабируемое параллельное обучение на большом количестве GPU, охватывающих несколько компьютеров.

Question 5

Является ли CNTK достаточно гибким для моей собственной сети?

Accepted Answer

В дополнение к широкому спектру встроенных вычислительных узлов CNTK предоставляет архитектуру подключаемого модуля, позволяющую пользователям определять собственные вычислительные узлы. Поэтому если для рабочей нагрузки требуется специальная настройка, CNTK упрощает выполнение этой задачи. Читатели также полностью настраиваются, что позволяет поддерживать произвольные форматы ввода.

Question 6

Каковы ключевые алгоритмы обучения, поддерживаемые CNTK?

Accepted Answer

Сегодня CNTK поддерживает следующие алгоритмы:

Переадресация веб-канала
CNN
Рекуррентная нейронная сеть
LSTM
Последовательность — последовательность.

Question 7

Кто люди за CNTK?

Accepted Answer

CNTK разрабатывается отделом технологий и исследований Корпорации Майкрософт. Кроме того, CNTK получает значительные вклады практически всех производственных команд Майкрософт.

Question 8

Когда началось работа над CNTK?

Accepted Answer

Разработка CNTK ведется с конца 2014 года.

Question 9

Оптимизирована ли CNTK только для обучения распознаванию речи?

Accepted Answer

Нет. CNTK используется в рабочей среде для распознавания речи, а также для обучения изображения и текста.

Question 10

Как использовать CNTK?

Accepted Answer

Использование CNTK просто и просто. Вот несколько способов начать работу.

Question 11

Почему CNTK рандомизирует мини-пакеты после каждой эпохи?

Accepted Answer

При этом одни и те же образцы всегда отображаются в мини-пакете вместе. Это приводит к улучшению точности проверки.

Question 12

Можно ли использовать встроенные средства чтения для обучения сетевой модели с помощью нескольких входных файлов?

Accepted Answer

Да. Ознакомьтесь с описанием в разделе " Общие сведения и расширение средств чтения" и найдите раздел, описывающий, как создать несколько десериализаторов данных.

Question 13

Как последовательности обрабатываются в CNTK?

Accepted Answer

См. эту статью , как работать с последовательностями.

Question 14

При просмотре раскрывающегося списка выбрана скрытая единица, опущенная для всего мини-пакета, так как обновления происходят только после minibatchSize?

Accepted Answer

Обычно для разных выборок в одном мини-пакете для разных выборок задано значение 0. Для повторяющихся нейронных сетей некоторые люди ограничивают удаление одного набора скрытых единиц во времени для одной последовательности.

Question 15

Документация по удалению упоминает о скрытых единицах, применяется ли удаление к единицам в сверточных слоях, если их несколько?

Accepted Answer

Слой свертки также является скрытым слоем, если он не является последним выходным слоем.

Question 16

Можно ли указать разные коэффициенты перетаскивания для разных слоев?

Accepted Answer

В CNTK необходимо явно указать использование раскрывающегося списка. Например, если у исходной модели есть h2=W1*h1 и вы хотите применить раскрывающийся список, h1 его необходимо изменить на h2=W1*Dropout(h1). В настоящее время в BrainScript CNTK можно указать только одну частоту выпадений для всех узлов раскрывающегося списка, используемых в одной модели. Однако он позволяет выбрать разные коэффициенты отсева между эпохами. В API Python можно указать разные коэффициенты выпадания для каждого слоя.

BTW, мы не большие поклонники использования различных значений для различных раскрывающихся значений или исходных значений модели. Это приведет к значительному увеличению числа определяемых гиперпараметров. Если это используется в продукте, это означает, что модель не имеет инженерной стабильности.

Question 17

Можно ли применять ограничения веса вместо термина регуляризации L2?

Accepted Answer

Да, вы можете вычислить все данные на основе веса и добавить его в основной критерий и использовать комбинированный критерий в качестве цели обучения.

Question 18

Может ли API Python считывать модели обученного стиля BrainScript?

Accepted Answer

Да, вы можете читать модели, обученные BrainScript.

Часто задаваемые вопросы о CNTK