独自の機械学習 (ML) を Microsoft Sentinel に導入する

[アーティクル]
06/01/2023

注意

米国政府機関クラウドにおける機能使用可否の詳細については、「米国政府機関のお客様向けのクラウド機能の利用可能性」に記載されている Microsoft Sentinel テーブルを参照してください。

機械学習 (ML) は Microsoft Sentinel の主要な基盤の 1 つであり、他と一線を画す理由である主な属性の 1 つです。 Microsoft Sentinel では、次に示すようないくつかのエクスペリエンスで ML が提供されます。Fusion 相関関係エンジン、Jupyter Notebook、新しく使用可能になった Build-Your-Own ML (BYO ML) (独自の ML 構築) プラットフォームに組み込まれています。

ML 検出モデルでは、個々の環境とユーザー動作の変化に適応して誤検知を減らし、従来のアプローチでは検出されない脅威を特定することができます。多くのセキュリティ組織がセキュリティに対する ML の価値を理解していますが、セキュリティと ML の両方の専門知識を持っているプロフェッショナルは多くはありません。ここで紹介するフレームワークは、セキュリティ組織とプロフェッショナルが ML の取り組みの中で成長できるように設計されています。 ML を初めて使用する組織、または必要な専門知識を持たない組織も、Microsoft Sentinel の組み込み ML 機能から大きな保護価値を得ることができます。

機械学習フレームワーク

独自の機械学習 (BYO-ML) プラットフォームとは

ML リソースがあり、独自のビジネスニーズに合わせてカスタマイズされた ML モデルを構築する必要がある組織には、BYO-ML プラットフォームを提供しています。このプラットフォームでは、Azure Databricks/Apache Spark 環境と Jupyter Notebook を使用して ML 環境を生成します。提供されるコンポーネントを次に示します。

BYO-ML パッケージ。データにアクセスして結果を Log Analytics (LA) にプッシュするために役立つライブラリが含まれているため、結果を検出、調査、および検索に統合できます。
ML アルゴリズムテンプレート。組織内の特定のセキュリティ上の問題に合わせてカスタマイズすることができます。
モデルをトレーニングし、モデルのスコアリングをスケジュールするサンプルノートブック。

これ以外にも、独自の ML モデルや独自の Spark 環境を使用して Microsoft Sentinel と統合できます。

BYO-ML プラットフォームでは、独自の ML モデルの構築に関するジャンプスタートを利用できます。

サンプルデータを含むノートブックを使用すると、運用データの処理を気にせずに、実践的な体験をエンドツーエンドで行うことができます。
Spark 環境に統合されたパッケージにより、インフラストラクチャの管理における課題と摩擦が軽減されます。
これらのライブラリはデータ移動をサポートしています。トレーニングノートブックとスコアリングノートブックは、エンドツーエンドのエクスペリエンスのデモンストレーションであり、環境に合わせるためのテンプレートとして機能します。

ユースケース

BYO-ML プラットフォームとパッケージによって、独自の ML 検出を構築するために必要な時間と労力が大幅に削減され、これにより Microsoft Sentinel で特定のセキュリティ問題に対処する機能が得られます。このプラットフォームでは、次のユースケースがサポートされています。

ML アルゴリズムをトレーニングして、カスタマイズされたモデルを取得する: (Microsoft またはユーザーコミュニティによって共有されている) 既存の ML アルゴリズムを使用して、独自のデータで簡単にトレーニングを行い、データと環境に合わせてカスタマイズされた ML モデルを取得できます。

ML アルゴリズムテンプレートを変更して、カスタマイズされたモデルを取得する: (Microsoft またはユーザーコミュニティによって共有されている) ML アルゴリズムテンプレートを変更し、独自のデータに対して変更されたアルゴリズムをトレーニングして、特定の問題に合わせてカスタマイズされたモデルを作成することができます。

独自のモデルを作成する: Microsoft Sentinel の BYO-ML プラットフォームとユーティリティを使用して、独自のモデルをゼロから作成することができます。

Databricks/Spark 環境を統合する: 既存の Databricks/Spark 環境を Microsoft Sentinel に統合し、BYO-ML ライブラリとテンプレートを使用して、独自の状況に合わせて ML モデルを構築します。

独自の ML モデルをインポートする: 独自の ML モデルをインポートし、BYO-ML プラットフォームとユーティリティを使用して Microsoft Sentinel と統合できます。

ML アルゴリズムを共有する: ML アルゴリズムを共有して、コミュニティが採用して適応できるようにします。

ML を使用して SecOps を強化する: 独自のカスタム ML モデルと、検索、検出、調査、および対応の結果を使用します。

この記事では、BYO-ML プラットフォームのコンポーネントと、プラットフォームと異常なリソースアクセスアルゴリズムを活用して、Microsoft Sentinel でカスタマイズされた ML 検出を提供する方法について説明します。

Azure Databricks/Spark 環境

Apache Spark は、データパイプラインを構築するための統一されたフレームワークを提供することで、ビッグデータの単純化を進歩させました。 Azure Databricks は、Spark を中心に構築されたゼロ管理クラウドプラットフォームを提供することで、これをさらに強化します。 BYO-ML プラットフォームには Databricks を使用することをお勧めします。これにより、データパイプラインやプラットフォームの問題に取り組むのではなく、ビジネスに直ちに影響を与える答えを探すことに専念できます。

既に Databricks またはその他の Spark 環境があり、既存のセットアップを使用する場合は、BYO-ML パッケージも同様に機能します。

BYO-ML パッケージ

BYO ML パッケージには、セキュリティのための ML のフロントエンドにおける Microsoft のベストプラクティスと調査が含まれています。このパッケージには、セキュリティ上の問題について、次のユーティリティ、ノートブック、およびアルゴリズムテンプレートの一覧が用意されています。

ファイル名	説明
azure_sentinel_utilities.whl	Azure から BLOB を読み取り、Log Analytics に書き込むためのユーティリティが含まれています。
AnomalousRASampleData	ノートブックは、生成されたトレーニングとテストのサンプルデータを使用して、Microsoft Sentinel で異常なリソースアクセスモデルを使用する方法を示します。
AnomalousRATraining.ipynb	アルゴリズムをトレーニングし、モデルを作成して保存するためのノートブック。
AnomalousRAScoring.ipynb	モデルの実行のスケジュールを設定して結果を視覚化し、スコアを Microsoft Sentinel に書き込むためのノートブック。

最初に提供される ML アルゴリズムテンプレートは、異常なリソースアクセス検出用です。これは協調フィルタリングアルゴリズムに基づいており、Windows ファイル共有のアクセスログ (イベント ID 5140 のセキュリティイベント) でトレーニングされています。ログでこのモデルに必要な重要な情報は、アクセスされたユーザーとリソースの組み合わせです。

ここでは、BYO-ML プラットフォームの主要なコンポーネントについて説明しました。次の例では、このプラットフォームとコンポーネントを使用して、カスタマイズされた ML 検出を提供する方法を示します。

Databricks/Spark 環境の設定

まだお持ちでない場合は、独自の Databricks 環境を設定する必要があります。手順については、Databricks のクイックスタートに関するドキュメントを参照してください。

自動エクスポート命令

Microsoft Sentinel で独自のデータに基づいてカスタム ML モデルを作成するには、データを Log Analytics から Blob Storage またはイベントハブリソースにエクスポートし、ML モデルが Databricks からアクセスできるようにする必要があります。 Microsoft Sentinel にデータを取り込む方法について説明します。

この例では、Azure Blob Storage のファイル共有アクセスログのトレーニングデータが必要です。データの形式については、ノートブックとライブラリに記載されています。

Azure CLI を使用して、Log Analytics からデータを自動的にエクスポートできます。

コマンドを実行するには、Log Analytics ワークスペース、ストレージアカウント、および EventHub リソースの共同作成者ロールが割り当てられている必要があります。

自動エクスポートを設定するためのコマンドのサンプルセットを次に示します。


az –version

# Login with Azure CLI
az login

# List all Log Analytics clusters
az monitor log-analytics cluster list

# Set to specific subscription
az account set --subscription "SUBSCRIPTION_NAME"
 
# Export to Storage - all tables
az monitor log-analytics workspace data-export create --resource-group "RG_NAME" --workspace-name "WS_NAME" -n LAExportCLIStr --destination "DESTINATION_NAME" --enable "true" --tables SecurityEvent
 
# Export to EventHub - all tables
az monitor log-analytics workspace data-export create --resource-group "RG_NAME" --workspace-name "WS_NAME" -n LAExportCLIEH --destination "DESTINATION_NAME" --enable "true" --tables ["SecurityEvent","Heartbeat"]

# List export settings
az monitor log-analytics workspace data-export list --resource-group "RG_NAME" --workspace-name "WS_NAME"

# Delete export setting
az monitor log-analytics workspace data-export delete --resource-group "RG_NAME" --workspace-name "WS_NAME" --name "NAME"

カスタムデータをエクスポートする

Log Analytics の自動エクスポートでサポートされていないカスタムデータの場合は、ロジックアプリまたはその他のソリューションを使用してデータを移動できます。ブログ記事「Log Analytics データを BLOB ストアにエクスポートする」とスクリプトを参照してください。

Microsoft Sentinel 以外のデータとの関連付け

Microsoft Sentinel の外部から Blob Storage またはイベントハブにデータを取り込み、それを Microsoft Sentinel データと関連付けて ML モデルを構築することもできます。

前述の Microsoft Sentinel GitHub リポジトリから Databricks 環境に BYO-ML パッケージをコピーします。次にノートブックを開き、ノートブック内の指示に従って、必要なライブラリをクラスターにインストールします。

モデルのトレーニングとスコアリング

2 つのノートブックに記載されている手順に従って自分の環境とリソースに応じて構成を変更し、モデルのトレーニングとビルドの手順に従ってから、ファイル共有アクセスの受信ログをスコアリングするようにモデルをスケジュールします。

結果を Log Analytics に書き込む

スコアリングのスケジュールが設定されると、スコアリングノートブックのモジュールを使用して、Microsoft Sentinel インスタンスに関連付けられている Log Analytics ワークスペースにスコアの結果を書き込むことができます。

Microsoft Sentinel で結果を確認する

スコアリングされた結果を関連ログの詳細と共に表示するには、Microsoft Sentinel ポータルに戻ります。 [ログ]> [カスタムログ] で、AnomalousResourceAccessResult_CL テーブル (または独自のカスタムテーブル名) に結果が表示されます。これらの結果を使用して、調査と検索のエクスペリエンスを向上させることができます。

異常なリソースアクセスログ

ML の結果を使用してカスタム分析ルールを作成する

ML の結果がカスタムログテーブルにあり、スコアの忠実度が満たされていることを確認したら、結果に基づいて検出を作成できます。 Microsoft Sentinel ポータルから [Analytics] にアクセスし、新しい検出ルールを作成します。検出の作成に使用されるクエリの例を次に示します。

B Y O M L 検出のためのカスタム分析ルールを作成する

インシデントを表示して対応する

ML の結果に基づいて分析ルールを設定した後、クエリで設定したしきい値を超える結果が発生すると、インシデントが生成されて Microsoft Sentinel の [インシデント] ページに表示されます。

次のステップ

このドキュメントでは、Microsoft Sentinel の BYO-ML プラットフォームを使用して、データを分析して脅威を検出する独自の機械学習アルゴリズムを作成またはインポートする方法について学習しました。

Microsoft Sentinel ブログにある機械学習やその他の関連トピックに関する投稿をご覧ください。