クイックスタート: Azure Batch で Microsoft プラネタリーコンピューター Pro GeoCatalog を使用する

このクイックスタートでは、Azure Batch で Microsoft Planetary Computer Pro GeoCatalog リソースを使用して地理空間データを大規模に処理する方法について説明します。

Azure Batch は、大規模な並列コンピューティングとハイパフォーマンスコンピューティング (HPC) ワークロードを実行できるクラウドベースのジョブスケジューリングサービスです。 Azure Batch と Microsoft Planetary Computer Pro を組み合わせることで、次のことができます。

複数のコンピューティングノード間で大量の地理空間データを並列に処理する
マネージド ID を使用して GeoCatalog API に対して安全に認証する
ワークロードの需要に基づいて処理能力をスケールアップまたはスケールダウンする
インフラストラクチャを管理せずに地理空間データパイプラインを自動化する

このクイックスタートでは、ユーザー割り当てマネージド ID を使用して Batch プールを設定し、GeoCatalog にアクセスするためのアクセス許可を構成し、STAC API にクエリを実行するジョブを実行する方法について説明します。

ヒント

Microsoft Planetary Computer Pro を使用したアプリケーション開発オプションの概要については、データを使用したアプリケーションの接続とビルドに関するページを参照してください。

[前提条件]

開始する前に、このクイックスタートを完了するために次の要件を満たしていることを確認してください。

アクティブなサブスクリプションを持つ Azure アカウント。 [アカウントの作成] リンクを無料で使用します。
マイクロソフトプラネタリーコンピューター Pro GeoCatalog リソース。次のツールがインストールされている Linux マシン。
- Azure CLI
- perl パッケージ。

Batch アカウントを作成する

リソースグループを作成します。

az group create \
    --name spatiobatchdemo \
    --location uksouth

ストレージアカウントを作成します。

az storage account create \
    --resource-group spatiobatchdemo \
    --name spatiobatchstorage \
    --location uksouth \
    --sku Standard_LRS

Storage Blob Data Contributorを現在のユーザーにストレージアカウントに割り当てます。

az role assignment create \
    --role "Storage Blob Data Contributor" \
    --assignee $(az account show --query user.name -o tsv) \
    --scope $(az storage account show --name spatiobatchstorage --resource-group spatiobatchdemo --query id -o tsv)

Batch アカウントを作成します。

az batch account create \
    --name spatiobatch \
    --storage-account spatiobatchstorage \
    --resource-group spatiobatchdemo \
    --location uksouth

Von Bedeutung

コンピューターノードのプールを作成するのに十分なクォータがあることを確認します。十分なクォータがない場合は、 Azure Batch のクォータと制限に関するドキュメントの手順に従って、引き上げを要求できます。

次のコマンドを実行して、新しい Batch アカウントにサインインします。

az batch account login \
    --name spatiobatch \
    --resource-group spatiobatchdemo \
    --shared-key-auth

Batch を使用してアカウントを認証すると、このセッションの後続の az batch コマンドで作成した Batch アカウントが使用されます。

ユーザー割り当てマネージド ID を作成します。

az identity create \
    --name spatiobatchidentity \
    --resource-group spatiobatchdemo

Azure portal を使用してコンピューティングノードのプールを作成します。

Azure portal で Batch アカウントに移動し、[ プール] を選択します。
[ + 追加] を選択して新しいプールを作成し、プールの ID として [ユーザー割り当て ] を選択します。
前に作成したユーザー割り当てマネージド ID を選択します。
お好みのオペレーティングシステムと VM のサイズを選択します。このデモでは、Ubuntu Server 20.04 LTS を使用します。
[タスクの開始] を有効にし、次のコマンドラインを設定します。bash -c "apt-get update && apt-get install jq python3-pip -y && curl -sL https://aka.ms/InstallAzureCLIDeb | bash"し、[昇格レベル] を [プールの自動ユーザー] に設定します。管理者:
[ OK] を 選択してプールを作成します。

マネージド ID にアクセス許可を割り当てる

GeoCatalog へのマネージド ID アクセスを提供する必要があります。 GeoCatalog に移動し、 アクセス制御 (IAM) を選択し、[ ロールの割り当ての追加] を選択します。

ニーズ、 GeoCatalog Administrator 、または GeoCatalog Readerに基づいて適切なロールを選択し、[ 次へ] を選択します。

作成したマネージド ID を選択し、[ 確認と割り当て] を選択します。

Batch ジョブを準備する

ストレージアカウントにコンテナーを作成します。

az storage container create \
    --name scripts \
    --account-name spatiobatchstorage

スクリプトをコンテナーにアップロードします。

az storage blob upload \
    --container-name scripts \
    --file src/task.py \
    --name task.py \
    --account-name spatiobatchstorage

Batch ジョブを実行する

このクイックスタートには、 Python スクリプトと Bash スクリプトの 2 つの例があります。いずれかを使用してジョブを作成できます。

Python スクリプトタスク

Python スクリプトジョブを実行するには、次のコマンドを実行します。

geocatalog_url="<geocatalog url>"
token_expiration=$(date -u -d "30 minutes" "+%Y-%m-%dT%H:%M:%SZ")
python_task_url=$(az storage blob generate-sas --account-name spatiobatchstorage --container-name scripts --name task.py --permissions r --expiry $token_expiration --auth-mode login --as-user --full-uri -o tsv)

cat src/pythonjob.json | perl -pe "s,##PYTHON_TASK_URL##,$python_task_url,g" | perl -pe "s,##GEOCATALOG_URL##,$geocatalog_url,g" | az batch job create --json-file /dev/stdin

Python ジョブは、次の Python スクリプトを実行します。

import json
from os import environ
import requests
from azure.identity import DefaultAzureCredential

MPCPRO_APP_ID = "https://geocatalog.spatio.azure.com"
credential = DefaultAzureCredential()
access_token = credential.get_token(f"{MPCPRO_APP_ID}/.default")

geocatalog_url = environ["GEOCATALOG_URL"]

response = requests.get(
    f"{geocatalog_url}/stac/collections",
    headers={"Authorization": "Bearer " + access_token.token},
    params={"api-version": "2025-04-30-preview"},
)
print(json.dumps(response.json(), indent=2))

DefaultAzureCredentialを使用してマネージド ID で認証し、GeoCatalog からコレクションを取得します。ジョブの結果を取得するには、次のコマンドを実行します。

az batch task file download \
    --job-id pythonjob1 \
    --task-id task1 \
    --file-path "stdout.txt" \
    --destination /dev/stdout

Bash ジョブ

Bash スクリプトジョブを実行するには、次のコマンドを実行します。

geocatalog_url="<geocatalog url>"

cat src/bashjob.json | perl -pe "s,##GEOCATALOG_URL##,$geocatalog_url,g" | az batch job create --json-file /dev/stdin

Bash ジョブは、次の Bash スクリプトを実行します。

az login --identity --allow-no-subscriptions > /dev/null
token=$(az account get-access-token --resource https://geocatalog.spatio.azure.com --query accessToken --output tsv)
curl --header \"Authorization: Bearer $token\" $GEOCATALOG_URL/stac/collections | jq

az login --identityを使用してマネージド ID で認証し、GeoCatalog からコレクションを取得します。ジョブの結果を取得するには、次のコマンドを実行します。

az batch task file download \
    --job-id bashjob1 \
    --task-id task1 \
    --file-path "stdout.txt" \
    --destination /dev/stdout

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-01-10