Azure Monitor エージェントを使用してテキストファイルからログを収集する

[アーティクル]
11/01/2024

カスタムテキストログは、データ収集ルール (DCR) で使用されるデータソースの 1 つです。 DCR の作成の詳細については、「Azure Monitor エージェントを使用してデータを収集する」を参照してください。この記事では、テキストログの種類の詳細について説明します。

多くのアプリケーションとサービスでは、Windows イベントログや Syslog などの標準のログ記録サービスの代わりに、テキストファイルに情報を記録します。このデータは、Azure Monitor エージェントを使用して収集し、他のソースから収集されたデータとともに Log Analytics ワークスペースに格納できます。

前提条件

少なくとも共同作成者権限がある Log Analytics ワークスペース。
このデータ収集エンドポイント (DCE) は、Log Analytics ワークスペースと同じリージョン内に存在します。詳細については、「デプロイに基づいてデータ収集エンドポイントを設定する方法」を参照してください。
「Azure Monitor エージェントを使用してデータを収集する」で説明されている新規または既存の DCR。

基本的な操作

次の図は、テキストファイルからログデータを収集する基本的な操作を示しています。

エージェントは、ローカルディスク上の指定された名前パターンと一致するすべてのログファイルを監視します。
ログ内の各エントリが収集され、Azure Monitor に送信されます。受信ストリームでは、ログエントリ全体が 1 つの列に含まれます。
既定の変換が使用されている場合、ログエントリ全体がターゲットテーブルの 1 つの列に送信されます。
カスタム変換が使用されている場合、ログエントリをターゲットテーブル内の複数の列に分割できます。

テキストファイルの要件とベストプラクティス

Azure Monitor エージェントが監視しているファイルは、次の要件を満たしている必要があります。

ファイルは、Azure Monitor エージェントがあるコンピューターのローカルドライブの、監視対象のディレクトリ内に格納する必要があります。
各レコードは、行末で区切る必要があります。
ファイルでは、ASCII または UTF-8 エンコードを使用する必要があります。 UTF-16 など他の形式はサポートされていません。
新しいレコードは、古いレコードを上書きせず、ファイルの末尾に追加する必要があります。上書きすると、データが失われます。

データの損失やパフォーマンスの問題が発生しないように、次の推奨事項に従ってください。

古いファイルを簡単にクリーンアップできるように、毎日新しいログファイルを作成します。
監視対象ディレクトリのログファイルを継続的にクリーンアップします。多くのログファイルを追跡すると、エージェントの CPU とメモリの使用量が増える可能性があります。すべてのログが処理されるための十分な時間を確保できるよう、少なくとも 2 日間待ちます。
ファイルスキャンのパターンと一致するファイルの名前を、ファイルスキャンのパターンと一致する別の名前に変更しないでください。これにより、重複するデータが取り込まれることになります。
ファイルスキャンのパターンと一致する大規模ログファイルの名前を変更したり、監視対象のディレクトリにコピーしたりしないでください。必要な場合は、1 分あたり 50 MB を超えないようにしてください。

着信ストリーム

Note

区切りイベントにタイムスタンプを使用する複数行のサポートが利用可能になりました。ポータル UI にサポートが追加されるまでは、リソース管理テンプレートのデプロイを使用する必要があります。

データの受信ストリームには、次の表にある列が含まれています。

列	タイプ	説明
`TimeGenerated`	datetime	レコードが生成された時刻。この値には、レコードが Log Analytics ワークスペースに追加された時刻が自動的に設定されます。変換を使用してこの値をオーバーライドして、`TimeGenerated` を別の値に設定できます。
`RawData`	string	1 つの列のログエントリ全体。このデータを複数の列に分割してからテーブルに送信する場合は、変換を使用できます。
`FilePath`	string	この列を DCR の受信ストリームに追加すると、ログファイルへのパスが設定されます。この列は自動的には作成されず、ポータルを使用して追加することはできません。ポータルによって作成された DCR を手動で変更するか、受信ストリームを明示的に定義できる別の方法を使用して DCR を作成する必要があります。
`Computer`	string	この列を DCR の受信ストリームに追加すると、ログファイルのあるコンピューターの名前が設定されます。この列は自動的には作成されず、ポータルを使用して追加することはできません。ポータルによって作成された DCR を手動で変更するか、受信ストリームを明示的に定義できる別の方法を使用して DCR を作成する必要があります。

カスタムテーブル

テキストファイルからログデータを収集する前に、Log Analytics ワークスペースにカスタムテーブルを作成してデータを受信する必要があります。テーブルスキーマは、収集するデータと一致する必要があります。または、出力スキーマがテーブルと一致するように変換を追加する必要があります。

警告

データ損失を回避するには、MMA エージェントによって現在使用されている既存のカスタムログテーブルを使用しないことが重要です。 AMA エージェントで既存のカスタムログテーブルに書き込みを行うと、MMA エージェントからそのテーブルへの書き込みを実行できなくなります。その代わり、AMA エージェント専用の新しいテーブルを作成することで、エージェント間のスムーズな切り替えを確実に実行できます。

たとえば、次の PowerShell スクリプトを使用すると、RawData、FilePath、Computer を含むカスタムテーブルを作成できます。スキーマは受信ストリームの既定のスキーマと一致するため、このテーブルの変換は必要ありません。

$tableParams = @'
{
    "properties": {
        "schema": {
               "name": "{TableName}_CL",
               "columns": [
                    {
                        "name": "TimeGenerated",
                        "type": "DateTime"
                    }, 
                    {
                        "name": "RawData",
                        "type": "String"
                    },
                    {
                        "name": "FilePath",
                        "type": "String"
                    },
                    {
                        "name": "Computer",
                        "type": "String"
                    }
              ]
        }
    }
}
'@

Invoke-AzRestMethod -Path "/subscriptions/{subscription}/resourcegroups/{resourcegroup}/providers/microsoft.operationalinsights/workspaces/{WorkspaceName}/tables/{TableName}_CL?api-version=2021-12-01-preview" -Method PUT -payload $tableParams

Azure Monitor エージェントを使用したデータの収集に関するページの説明に従って、データ収集ルールを作成します。 [収集と配信] 手順で、[データソースの種類] ドロップダウンから [カスタムテキストログ] を選択します。

設定	説明
ファイルパターン	ローカルディスク上のログファイルの場所と名前を確認します。新しい名前で毎日新しいファイルが作成される場合など、異なるファイル名にはワイルドカードを使用します。複数のファイルパターンをコンマで区切って入力できます。例 : - C:\Logs\MyLog.txt - C:\Logs\MyLog.txt - C:\App01\AppLog.txt, C:\App02\AppLog.txt - /var/mylog.log - /var/mylog.log
テーブル名	Log Analytics ワークスペースの宛先テーブルの名前。
レコードの区切り記号	現在は使用されていませんが、将来の使用のために予約されており、現在サポートされている行末以外の区切り記号 (`/r/n`) を許可します。
変換	インジェスト時の変換を行ってレコードをフィルター処理したり、変換先テーブルの受信データを書式設定したりします。 `source` を使用して、受信データを変更せずに残します。

次の ARM テンプレートを使用して、テキストログファイルを収集するための DCR を作成し、前のセクションで説明した変更を行います。次の表では、テンプレートを展開するときに値を必要とするパラメーターについて説明します。

設定	説明
ファイルパターン	ローカルディスク上のログファイルの場所と名前を確認します。新しい名前で毎日新しいファイルが作成される場合など、異なるファイル名にはワイルドカードを使用します。複数のファイルパターンをコンマで区切って入力できます。例 : - C:\Logs\MyLog.txt - C:\Logs\MyLog.txt - C:\App01\AppLog.txt, C:\App02\AppLog.txt - /var/mylog.log - /var/mylog.log
テーブル名	Log Analytics ワークスペースの宛先テーブルの名前。
レコードの区切り記号	現在は使用されていませんが、将来の使用のために予約されており、現在サポートされている行末以外の区切り記号 (`/r/n`) を許可します。
変換	インジェスト時の変換を行ってレコードをフィルター処理したり、変換先テーブルの受信データを書式設定したりします。 `source` を使用して、受信データを変更せずに残します。
timeFormat	次の時刻の形式がサポートされています。 ARM テンプレートで引用符文字列を使用します。括弧内のサンプル時間は含めないでください。 - “yyyy-MM-ddTHH:mm:ssk” (2024-10-29T18:28:34) - “YYYY-MM-DD HH:MM:SS” (2024-10-29 18:28:34) - “M/D/YYYY HH:MM:SS AM/PM” (10/29/2024 06:28:34 PM) - “Mon DD, YYYY HH:MM:SS” (Oct[ober] 29, 2024 18:28:34) - “yyMMdd HH:mm:ss” (241029 18:28:34) - “ddMMyy HH:mm:ss” (291024 18:28:34) - “MMM d HH:mm:ss” (Oct 29 18:28:34) - “dd/MMM/yyyy:HH:mm:ss zzz” (14/Oct/2024:18:28:34 -000)

次の ARM テンプレートを使用して、テキストログファイルを収集するための DCR を作成または変更します。パラメーター値に加えて、テンプレートで次の値を変更することが必要になる場合があります。

columns: FilePath 列を収集しない場合は削除します。
transformKql: 受信ストリームを変更またはフィルター処理する場合 (ログエントリを複数の列に分割する場合など) は、既定の変換を変更します。変換の出力スキーマは、ターゲットテーブルのスキーマと一致する必要があります。

重要

ARM テンプレートを使用して DCR を作成する場合でも、使用するエージェントに DCR を関連付ける必要があります。 Azure portal で DCR を編集し、「リソースの追加」の説明に従ってエージェントを選択します。 DCR のパラメーターセクションは、JSON の下位にある文字列に置き換えた場合は省略できます。

{
    "$schema": "https://schema.management.azure.com/schemas/2019-04-01/deploymentTemplate.json#",
    "contentVersion": "1.0.0.0",
    "parameters": {
        "dataCollectionRuleName": {
            "type": "string",
            "metadata": {
              "description": "Unique name for the DCR. "
            }
        },
        "dataCollectionEndpointResourceId": {
            "type": "string",
            "metadata": {
              "description": "Resource ID of the data collection endpoint (DCE)."
            }
        },
        "location": {
            "type": "string",
            "metadata": {
              "description": "Region for the DCR. Must be the same location as the Log Analytics workspace. "
            }
        },
        "filePatterns": {
            "type": "string",
            "metadata": {
              "description": "Path on the local disk for the log file to collect. May include wildcards.Enter multiple file patterns separated by commas (AMA version 1.26 or higher required for multiple file patterns on Linux)."
            }
        },
        "tableName": {
            "type": "string",
            "metadata": {
              "description": "Name of destination table in your Log Analytics workspace. "
            }
        },
        "workspaceResourceId": {
            "type": "string",
            "metadata": {
              "description": "Resource ID of the Log Analytics workspace with the target table."
            }
        },
        "timeFormat": {
            "type": "string"
            "metadata": {
                "discription": "The time format that you would like to use to split multi line imput"
            }
      }
    },
    "variables": {
      "tableOutputStream": "[concat('Custom-', parameters('tableName'))]"
    },
    "resources": [
        {
            "type": "Microsoft.Insights/dataCollectionRules",
            "name": "[parameters('dataCollectionRuleName')]",
            "location": "[parameters('location')]",
            "apiVersion": "2022-06-01",
            "properties": {
                "dataCollectionEndpointId": "[parameters('dataCollectionEndpointResourceId')]",
                "streamDeclarations": {
                    "Custom-Text-stream": {
                        "columns": [
                            {
                                "name": "TimeGenerated",
                                "type": "datetime"
                            },
                            {
                                "name": "RawData",
                                "type": "string"
                            },
                            {
                                "name": "FilePath",
                                "type": "string"
                            },
                            {
                                "name": "Computer",
                                "type": "string"
                            }
                        ]
                    }
                },
                "dataSources": {
                    "logFiles": [
                        {
                            "streams": [
                                "Custom-Text-stream"
                            ],
                            "filePatterns": [
                                "[parameters('filePatterns')]"
                            ],
                            "format": "text",
                            "name": "Custom-Text-dataSource",
                            "settings": {
                               "text": {
                                      "recordStartTimestampFormat": "[parameters('timeFormat')]"
                               }
                            }
                        }
                    ]
                },
                "destinations": {
                    "logAnalytics": [
                        {
                            "workspaceResourceId": "[parameters('workspaceResourceId')]",
                            "name": "workspace"
                        }
                    ]
                },
                "dataFlows": [
                    {
                        "streams": [
                            "Custom-Text-dataSource"
                        ],
                        "destinations": [
                            "workspace"
                        ],
                        "transformKql": "source",
                        "outputStream": "[variables('tableOutputStream')]"
                    }
                ]
            }
        }
    ]
}

区切りログファイル

多くのテキストログファイルには、コンマなどの文字で区切られたエントリがあります。このデータを個別の列に分割するには、分割関数で変換を使用します。

たとえば、次のコンマ区切りのデータを含むテキストファイルについて考えてみます。これらのフィールドは、Time、Code、Severity、Module、および Message として記述できます。

2024-06-21 19:17:34,1423,Error,Sales,Unable to connect to pricing service.
2024-06-21 19:18:23,1420,Information,Sales,Pricing service connection established.
2024-06-21 21:45:13,2011,Warning,Procurement,Module failed and was restarted.
2024-06-21 23:53:31,4100,Information,Data,Nightly backup complete.

次の変換により、データが個別の列に解析されます。 split は動的データを返すので、tostring や toint などの関数を使用して、データを正しいスカラー型に変換する必要があります。また、ターゲットテーブル内の列名と一致する各エントリの名前を指定する必要もあります。この例では、TimeGenerated 値が設定されることに注意してください。これが指定されていない場合は、インジェスト時間が使用されます。

source | project d = split(RawData,",") | project TimeGenerated=todatetime(d[0]), Code=toint(d[1]), Severity=tostring(d[2]), Module=tostring(d[3]), Message=tostring(d[4])

ログクエリでこのデータを取得すると、次の結果が返されます。

トラブルシューティング

想定しているテキストログからデータを収集しない場合は、次の手順を実行します。

収集されるログファイルにデータが書き込まれていることを確認します。
ログファイルの名前と場所が、指定したファイルパターンと一致することを確認します。
ターゲットテーブルのスキーマが受信ストリームと一致していること、または受信ストリームを正しいスキーマに変換する変換があることを確認します。
「操作の確認」を参照して、エージェントが動作していて、データが受信されているかどうかを確認します。

次のステップ

各項目の詳細情報

次の方法で共有

Azure Monitor エージェントを使用してテキストファイルからログを収集する

前提条件

基本的な操作

テキストファイルの要件とベストプラクティス

着信ストリーム

カスタムテーブル

テキストファイルのデータ収集ルールを作成する

区切りログファイル

トラブルシューティング

次のステップ

フィードバック

その他のリソース

次の方法で共有

Azure Monitor エージェントを使用してテキスト ファイルからログを収集する

前提条件

基本的な操作

テキスト ファイルの要件とベスト プラクティス

着信ストリーム

カスタム テーブル

テキスト ファイルのデータ収集ルールを作成する

区切りログ ファイル

トラブルシューティング

次のステップ

フィードバック

その他のリソース

Azure Monitor エージェントを使用してテキストファイルからログを収集する

テキストファイルの要件とベストプラクティス

カスタムテーブル

テキストファイルのデータ収集ルールを作成する

区切りログファイル