このクイックスタートでは、Azure ポータルを使用して、イベントのキャプチャを Azure Storage または Azure Data Lake Storage Gen 2 に向けて有効にします。 Event Hubs Capture は、Event Hubs のストリーミング データを任意のストレージ アカウントに自動的に配信します。
イベント ハブを作成するとき、または既存のイベント ハブのキャプチャ設定を構成できます。 この機能の概念については、Event Hubs Capture の概要に関するページを参照してください。
前提条件
- Azure サブスクリプション。 お持ちでない場合は、開始する前に無料アカウントを作成してください。
- Event Hubs 名前空間 (標準レベルまたはそれ以上)。 作成する必要がある場合は、「 Event Hubs 名前空間の作成」を参照してください。 Basic レベルでは、キャプチャ機能はサポートされていません。
- Azure Storage アカウント (ブロック BLOB がサポートされている Premium レベル)、または Azure Data Lake Storage Gen 2 アカウント。
イベント ハブの作成時に Capture を有効にする
使用できる Event Hubs 名前空間がない場合は、「Event Hubs 名前空間を作成する」の記事の手順に従って名前空間を作成します。 価格レベルで Standard 以上を選択していることを確認します。 Basic レベルでは Capture 機能はサポートされていません。
名前空間内にイベント ハブを作成するには、次の手順に従います。
名前空間の [概要] ページで、コマンド バーの [+ イベント ハブ] を選択します。
[ イベント ハブの作成 ] ページで、イベント ハブの名前を入力し、ページの下部にある [次へ: キャプチャ ] を選択します。
[キャプチャ] タブの [Capture] で [オン] を選択します。
スライダーをドラッグして、[時間枠] を分単位で設定します。 既定の時間ウィンドウは 5 分です。 最小値は 1 で、最大は 15 です。
スライダーをドラッグして、[サイズ枠 (MB)] を設定します。 既定値は 300 MB です。 最小値は 10 MB で、最大値は 500 MB です。
Event Hubs で Capture の時間枠中にイベントが発生しない場合に空のファイルを出力するかどうかを指定します。
キャプチャしたファイルを格納するには、使用するストレージの種類に基づいて、次のセクションのいずれかを参照してください。
重要
Azure Data Lake Storage Gen1 は廃止されたため、イベント データのキャプチャには使用しないでください。 詳細については、公式告知を参照してください。 Azure Data Lake Storage Gen1 をお使いの場合は、Azure Data Lake Storage Gen2 に移行してください。 詳細については、「Azure Data Lake Storage 移行のガイドラインとパターン」を参照してください。
Azure Storage へのデータのキャプチャ
[キャプチャ プロバイダー] では、[Azure Storage アカウント] (既定) を選択します。
Azure Storage コンテナでは、[コンテナを選択する] のリンクを選択します。
[ストレージ アカウント] ページで、データのキャプチャに使用するストレージ アカウントを選択します。
コンテナのページで、キャプチャしたファイルを格納するコンテナを選択し、[選択] をクリックします。
Event Hubs Capture ではストレージによるサービス間サービス認証が使用されるため、ストレージ接続文字列を指定する必要はありません。 リソース ピッカーにより、ストレージ アカウントのリソース URI が自動的に選択されます。 Azure Resource Manager を使用している場合は、この URI を文字列として明示的に指定する必要があります。
[ イベント ハブの作成 ] ページで、選択したコンテナーが表示されることを確認します。
[キャプチャ ファイル名の形式] には、キャプチャされたファイル名の形式を指定します。
ページ下部にある [確認と作成] を選択します。
[確認および作成] ページで設定を確認し、[作成] を選んでイベント ハブを作成します。
Note
ストレージ アカウントでパブリック アクセスが無効になっている場合は、Azure Event Hubs を含む信頼されるサービスにストレージ アカウントへのアクセスを許可します。 詳細と詳しい手順については、こちらの記事を参照してください。
Azure Data Lake Storage Gen 2 へのデータのキャプチャ
ストレージ アカウントの作成に関する記事に従って、Azure Storage アカウントを作成します。 [Advanced](詳細) タブで [階層型名前空間] を [Enabled](有効) に設定して、これを Azure Data Lake Storage Gen 2 アカウントにします。 Azure Storage アカウントは、イベント ハブと同じサブスクリプション内にある必要があります。
キャプチャ プロバイダーとして [Azure Storage] を選択します。 Azure Data Lake Storage Gen2を使用するには、Azure Storage を選択します。
Azure Storage コンテナでは、[コンテナを選択する] のリンクを選択します。
一覧から、[Azure Data Lake Storage Gen 2] アカウントを選択します。
[コンテナ] (Data Lake Storage Gen 2 のファイル システム) を選択し、ページの下部で [選択] を選びます。
[キャプチャ ファイル名の形式] には、キャプチャされたファイル名の形式を指定します。
ページ下部にある [確認と作成] を選択します。
[確認および作成] ページで設定を確認し、[作成] を選んでイベント ハブを作成します。
Note
このユーザー インターフェイス (UI) を使用して Azure Data Lake Storage Gen 2 で作成したコンテナーは、Storage Explorer の File systems の下に表示されます。 同様に、Data Lake Storage Gen 2 アカウントで作成したファイル システムは、この UI でコンテナーとして表示されます。
既存のイベント ハブに対する Capture の構成
Capture は、Event Hubs 名前空間内の既存のイベント ハブに対して構成することができます。 既存のイベント ハブで Capture を有効にするか、Capture の設定を変更するには、次の手順に従います。
名前空間のホーム ページで、左側のメニューの [エンティティ] で [Event Hubs] を選択します。
Capture 機能を構成するイベント ハブを選択します。
[Event Hubs Instance]\(Event Hubs インスタンス\) ページで、左側のメニューの [Capture]\(キャプチャ\) を選択します。
[Capture] ページで、[出力イベントのシリアル化形式] として [Avro] を選択します。 Parquet 形式は、Azure Stream Analytics 統合を介してのみサポートされます。 詳細については、「Parquet 形式で Event Hubs データをキャプチャし、Azure Synapse Analytics を使用して分析する」を参照してください。
[キャプチャ] で、[オン] を選択します。
その他の設定を構成するには、次のセクションを参照してください。
リソースをクリーンアップする
作成したリソースが不要になった場合は、料金が発生しないように削除します。
- Azure ポータルで Event Hubs 名前空間に移動します。
- 作成したイベント ハブを選択します。
- [ 削除] を 選択してイベント ハブを削除します。
すべてのリソースを一度に削除するには、名前空間を含むリソース グループを削除します。
関連コンテンツ
イベント データをキャプチャする際に、システム割り当て ID またはユーザー割り当てマネージド ID を使用できます。 まず名前空間のマネージド ID を有効にし、イベントをキャプチャするためのターゲット ストレージに対する適切なロールをその ID に付与し、マネージド ID を使用してイベントをキャプチャするようにイベント ハブを構成します。 詳細については、次の記事を参照してください。