培训
模块
使用 Azure 门户创建 Azure Batch 帐户 - Training
Azure Batch 是一项服务,可帮助用户在云中高效运行大规模并行和高性能计算 (HPC) 应用程序。 无需管理或配置基础结构。 只需安排作业,分配所需资源,然后让 Batch 执行其余操作。
你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
在本快速入门中,你将使用 Terraform 创建 Azure Batch 帐户、Azure 存储帐户和两个 Batch 池。 Batch 是一种基于云的作业计划服务,它可以将大量数据的处理并行化并分配到多台计算机上。 该服务通常用于参数扫描、Monte Carlo 模拟、财务风险建模和其他高性能计算应用程序。 Batch 帐户是 Batch 服务中的顶级资源,提供对池、作业和任务的访问权限。 存储帐户用于存储和管理 Batch 服务使用和生成的所有文件,而两个 Batch 池是执行任务的计算节点集合。
使用 Terraform 可以定义、预览和部署云基础结构。 使用 Terraform 时,请使用 HCL 语法来创建配置文件。 利用 HCL 语法,可指定 Azure 这样的云提供程序和构成云基础结构的元素。 创建配置文件后,请创建一个执行计划,利用该计划,可在部署基础结构更改之前先预览这些更改。 验证了更改后,请应用该执行计划以部署基础结构。
备注
本文中的示例代码位于 Azure Terraform GitHub 存储库中。 你可以查看包含当前和以前 Terraform 版本的测试结果的日志文件。
有关更多示例,请参阅演示如何使用 Terraform 管理 Azure 资源的文章和示例代码。
创建用于测试和运行示例 Terraform 代码的目录,并将其设为当前目录。
创建名为 main.tf
的文件并插入以下代码:
resource "random_pet" "rg_name" {
prefix = var.resource_group_name_prefix
}
resource "azurerm_resource_group" "rg" {
location = var.resource_group_location
name = random_pet.rg_name.id
}
resource "random_string" "storage_account_name" {
length = 8
lower = true
numeric = false
special = false
upper = false
}
resource "azurerm_storage_account" "example" {
name = random_string.storage_account_name.result
resource_group_name = azurerm_resource_group.rg.name
location = azurerm_resource_group.rg.location
account_tier = "Standard"
account_replication_type = "LRS"
}
resource "random_string" "batch_account_name" {
length = 8
lower = true
numeric = false
special = false
upper = false
}
resource "azurerm_batch_account" "example" {
name = random_string.batch_account_name.result
resource_group_name = azurerm_resource_group.rg.name
location = azurerm_resource_group.rg.location
storage_account_id = azurerm_storage_account.example.id
storage_account_authentication_mode = "StorageKeys"
}
resource "random_pet" "azurerm_batch_pool_name" {
prefix = "pool"
}
resource "azurerm_batch_pool" "fixed" {
name = "${random_pet.azurerm_batch_pool_name.id}-fixed-pool"
resource_group_name = azurerm_resource_group.rg.name
account_name = azurerm_batch_account.example.name
display_name = "Fixed Scale Pool"
vm_size = "Standard_A1"
node_agent_sku_id = "batch.node.ubuntu 22.04"
fixed_scale {
target_dedicated_nodes = 2
resize_timeout = "PT15M"
}
storage_image_reference {
publisher = "Canonical"
offer = "0001-com-ubuntu-server-jammy"
sku = "22_04-lts"
version = "latest"
}
start_task {
command_line = "echo 'Hello World from $env'"
task_retry_maximum = 1
wait_for_success = true
common_environment_properties = {
env = "TEST"
}
user_identity {
auto_user {
elevation_level = "NonAdmin"
scope = "Task"
}
}
}
metadata = {
"tagName" = "Example tag"
}
}
resource "azurerm_batch_pool" "autopool" {
name = "${random_pet.azurerm_batch_pool_name.id}-autoscale-pool"
resource_group_name = azurerm_resource_group.rg.name
account_name = azurerm_batch_account.example.name
display_name = "Auto Scale Pool"
vm_size = "Standard_A1"
node_agent_sku_id = "batch.node.ubuntu 22.04"
auto_scale {
evaluation_interval = "PT15M"
formula = <<EOF
startingNumberOfVMs = 1;
maxNumberofVMs = 25;
pendingTaskSamplePercent = $PendingTasks.GetSamplePercent(180 * TimeInterval_Second);
pendingTaskSamples = pendingTaskSamplePercent < 70 ? startingNumberOfVMs : avg($PendingTasks.GetSample(180 * TimeInterval_Second));
$TargetDedicatedNodes=min(maxNumberofVMs, pendingTaskSamples);
EOF
}
storage_image_reference {
publisher = "Canonical"
offer = "0001-com-ubuntu-server-jammy"
sku = "22_04-lts"
version = "latest"
}
}
创建名为 outputs.tf
的文件并插入以下代码:
output "resource_group_name" {
value = azurerm_resource_group.rg.name
}
output "storage_account_name" {
value = azurerm_storage_account.example.name
}
output "batch_account_name" {
value = azurerm_batch_account.example.name
}
output "batch_pool_fixed_name" {
value = azurerm_batch_pool.fixed.name
}
output "batch_pool_autopool_name" {
value = azurerm_batch_pool.autopool.name
}
创建名为 providers.tf
的文件并插入以下代码:
terraform {
required_version = ">=1.0"
required_providers {
azurerm = {
source = "hashicorp/azurerm"
version = "~>3.0"
}
random = {
source = "hashicorp/random"
version = "~>3.0"
}
}
}
provider "azurerm" {
features {}
}
创建名为 variables.tf
的文件并插入以下代码:
variable "resource_group_location" {
type = string
default = "eastus"
description = "Location of the resource group."
}
variable "resource_group_name_prefix" {
type = string
default = "rg"
description = "Prefix of the resource group name that's combined with a random ID so name is unique in your Azure subscription."
}
运行 terraform init,将 Terraform 部署进行初始化。 此命令将下载管理 Azure 资源所需的 Azure 提供程序。
terraform init -upgrade
要点:
-upgrade
可将必要的提供程序插件升级到符合配置版本约束的最新版本。运行 terraform plan 以创建执行计划。
terraform plan -out main.tfplan
要点:
terraform plan
命令将创建一个执行计划,但不会执行它。 它会确定创建配置文件中指定的配置需要执行哪些操作。 此模式允许你在对实际资源进行任何更改之前验证执行计划是否符合预期。-out
参数可以为计划指定输出文件。 使用 -out
参数可以确保所查看的计划与所应用的计划完全一致。运行 terraform apply,将执行计划应用到云基础结构。
terraform apply main.tfplan
要点:
terraform apply
命令假设你先前运行了 terraform plan -out main.tfplan
。-out
参数指定了不同的文件名,请在对 terraform apply
的调用中使用该相同文件名。-out
参数,请调用不带任何参数的 terraform apply
。运行 az batch account show
以查看 Batch 帐户。
az batch account show --name <batch_account_name> --resource-group <resource_group_name>
请将 <batch_account_name>
替换为 Batch 帐户的名称,将 <resource_group_name>
替换为资源组的名称。
不再需要通过 Terraform 创建的资源时,请执行以下步骤:
运行 terraform plan 并指定 destroy
标志。
terraform plan -destroy -out main.destroy.tfplan
要点:
terraform plan
命令将创建一个执行计划,但不会执行它。 它会确定创建配置文件中指定的配置需要执行哪些操作。 此模式允许你在对实际资源进行任何更改之前验证执行计划是否符合预期。-out
参数可以为计划指定输出文件。 使用 -out
参数可以确保所查看的计划与所应用的计划完全一致。运行 terraform apply 以应用执行计划。
terraform apply main.destroy.tfplan
培训
模块
使用 Azure 门户创建 Azure Batch 帐户 - Training
Azure Batch 是一项服务,可帮助用户在云中高效运行大规模并行和高性能计算 (HPC) 应用程序。 无需管理或配置基础结构。 只需安排作业,分配所需资源,然后让 Batch 执行其余操作。
文档
快速入门:使用 Terraform 创建 Azure Batch 帐户 - Azure Batch
在本文中,你将使用 Terraform 创建一个 Azure Batch 帐户
部署 Azure Batch 帐户和两个带有启动任务的池 - Terraform - Azure Batch
在本文中,你将使用 Terraform 部署 Azure Batch 帐户和两个带有启动任务的池。
快速入门:使用 Azure 门户创建 Batch 帐户并运行作业 - Azure Batch
请遵循本快速入门来使用 Azure 门户创建 Batch 帐户、计算节点池以及在池中运行基本任务的作业。