Планирование развертывания CycleCloud Production
Развертывание Azure CycleCloud
- Решите, какая версия CycleCloud будет развернута:
- Подготовка подписки Azure путем определения подписки, виртуальной сети, подсети и группы ресурсов для развертывания сервера CycleCloud
- Определите , какая группа ресурсов будет размещать кластеры или если CycleCloud должна создать их (параметр по умолчанию)
- Создание учетной записи хранения для доступа к хранилищу
- Определение того, будут ли использоваться ключи SSH, AD или LDAP для проверки подлинности.
- Определите, будет ли CycleCloud использовать субъект-службу или управляемое удостоверение (рекомендуется с одной подпиской) Выбор между субъектом-службой и управляемым удостоверением
- Подтвердите, какой номер SKU будет использоваться для CycleCloud: требования к системе CycleCloud
- Будет ли среда развернута в заблокированной сети? В этом случае учитывайте следующие требования: работа в заблокированной сети
- Развертывание сервера CycleCloud
Предупреждение
Убедитесь, что параметр "Включить иерархическое пространство имен" для Azure Data Lake Storage 2-го поколения не задан во время создания учетной записи хранения. CycleCloud не может использовать хранилище BLOB-объектов с поддержкой ADLS 2-го поколения в качестве хранилища.
Конфигурация Azure CycleCloud
- Войдите на сервер CycleCloud, создайте сайт и учетную запись администратора CycleCloud: CycleCloud Setup
- Создание хранилища CycleCloud , указывающего на учетную запись хранения
Конфигурация кластера Azure CycleCloud
- Определение доступа пользователей к управлению пользователями кластеров
- Определите, какой планировщик будет использоваться
- Определите, какой номер SKU потребуется для планировщика или головного узла
- Определите, какие номера SKU потребуются для узлов вычислений и выполнения. Это будет полностью зависеть от выполняемого приложения.
- Будут ли кластеры развертываться с помощью шаблона или вручную?
- Шаблоны кластера должны быть определены и отправлены в хранилище: справочник по шаблонам кластера
- Создание вручную: создание нового кластера
- Будут ли все скрипты выполняться на планировщике или выполнять узлы после развертывания:
Приложения
- Какие зависимости (библиотеки и т. д.) имеют приложения? Как они будут доступны?
- Сколько времени занимает установка и установка приложения? Это может определить, как приложение становится доступным для выполнения узлов и может потребовать пользовательского образа.
- Существуют ли зависимости лицензий, которые необходимо учитывать? Нужно ли приложению связаться с локальным сервером лицензирования?
- Определите, откуда будут выполняться приложения, это будет зависеть от времени установки и требований к производительности:
- С помощью пользовательского образа:
- Использование образа Marketplace
- Из общей папки NFS, хранилища BLOB-объектов, Azure NetApp Files
- Существует ли определенный номер SKU виртуальной машины, в котором должны использоваться приложения для запуска? Будет ли MPI требованием, так как это потребует другого семейства машин, таких как серия H?
- Какое число ядер будет оптимальным для каждого задания для каждого приложения?
- Можно ли использовать точечные виртуальные машины? Использование точечных виртуальных машин в CycleCloud
- Убедитесь, что квоты подписки установлены для выполнения основных требований для приложений.
Данные
- Определите, где будут находиться входные данные Azure. Это зависит от производительности приложений и размера данных.
- Локально на узлах выполнения
- Из общей папки NFS
- В хранилище BLOB-объектов
- Использование Azure NetApp Files
- Определение необходимости последующей обработки выходных данных
- Определите, где будут находиться выходные данные после завершения обработки
- Нужно ли копировать его в другое место?
- Какие требования к архиву и резервному копированию существуют?
Отправка задания
- Как пользователи будут отправлять задания?
- Будет ли у них есть скрипт для запуска на виртуальной машине планировщика или будет ли интерфейс для отправки данных и отправки заданий?
Резервное копирование и аварийное восстановление
- Будут ли шаблоны использоваться для создания кластера? Это сделает повторное создание сервера CycleCloud намного быстрее и согласованно в разных развертываниях.
- Каковы требования к аварийному восстановлению? Что произойдет с бизнесом, если регион Azure не был доступен должным образом?
- Существуют ли соглашения об уровне обслуживания приложений, определенные внутренним бизнесом?
- Можно ли использовать другой регион в качестве резервного сервера?
- Выполняются ли длительные задания? Будет ли полезно контрольные точки?