マイクロサービスのサービス間通信の設計

Azure DevOps

マイクロサービスの間の通信は、効率的かつ堅牢である必要があります。多数の小さいサービスが相互作用しながら 1 つのビジネスアクティビティを実行する場合、これを実現するのは容易ではない場合があります。この記事では、非同期メッセージングと同期 API の間のトレードオフについて説明します。その後、回復性の高いサービス間通信の設計におけるいくつかの課題について説明します。

課題

ここでは、サービス間通信において発生する主要な課題を示します。サービスメッシュ (後で説明します) は、これらの課題の多くに対処するように設計されています。

回復性。特定のマイクロサービスには、数十から場合によっては数百ものインスタンスが存在する可能性があります。インスタンスは、さまざまな理由で失敗することがあります。ハードウェア障害や仮想マシンの再起動のように、ノードレベルで障害が発生する場合があります。インスタンスがクラッシュしたり、要求の負荷が大きすぎて新しい要求を処理できなくなる場合もあります。これらのどのイベントによっても、ネットワーク呼び出しが失敗する可能性があります。サービス間ネットワーク呼び出しの回復力を高めるのに役立つ 2 つの設計パターンがあります。

再試行 。何もしなくても自動的に解消される一時的なエラーのために、ネットワーク呼び出し失敗することがあります。呼び出し元は、通常、すぐに失敗として処理するのではなく、一定の回数だけ、または構成されたタイムアウト期間が経過するまで、操作を再試行する必要があります。ただし、操作がべき等でない場合は、再試行によって意図しない副作用が発生する可能性があります。その場合、元の呼び出しが成功したとしても、呼び出し元は応答を取得できません。呼び出し元が再試行を行うと、操作が 2 回呼び出される可能性があります。一般に、POST または PATCH メソッドは、べき等が保証されていないため、再試行することは安全ではありません。
サーキットブレーカー 。失敗した要求が多すぎると、保留中の要求がキューに蓄積されるため、ボトルネックの原因になる可能性があります。これらのブロックされた要求が重要なシステムリソース (メモリ、しきい値、データベース接続など) を保持することで、障害が連鎖する可能性があります。サーキットブレーカーパターンを使うと、失敗する可能性がある操作をサービスで繰り返し再試行することを回避できます。

負荷分散。サービス "A" がサービス "B" を呼び出すとき、要求はサービス "B" の実行中のインスタンスに到達する必要があります。 Kubernetes では、Service リソースの種類はポッドのグループに対して安定した IP アドレスを提供します。サービスの IP アドレスへのネットワークトラフィックは、iptable の規則によってポッドに転送されます。既定では、ポッドはランダムに選ばれます。サービスメッシュ (後述) は、観察された待機時間や他のメトリックに基づいて、さらにインテリジェントな負荷分散アルゴリズムを提供できます。

分散トレース。 1 つのトランザクションで複数のサービスが利用される場合があります。その場合、システムの全体的なパフォーマンスと正常性の監視が困難になります。すべてのサービスがログとメトリックを生成する場合でも、それらを結び付ける何らかの手段がないと、役に立ちません。分散トレースについては、ログ記録と監視に関する記事で詳しく説明されていますが、ここでも課題としてそのことに触れます。

サービスのバージョン管理。チームは、新しいバージョンのサービスをデプロイするときに、他のサービスや、そのサービスに依存する外部クライアントで、中断が発生しないようにする必要があります。さらに、サービスの複数のバージョンをサイドバイサイドで実行し、要求を特定のバージョンにルーティングすることが必要になる場合があります。この問題について詳しくは、「API のバージョン管理」をご覧ください。

TLS 暗号化と相互 TLS 認証。セキュリティ上の理由から、サービス間のトラフィックを TLS で暗号化し、相互 TLS 認証を使って呼び出し元を認証することが必要な場合があります。

同期メッセージングと非同期メッセージング

マイクロサービス間の通信には、次の 2 つの基本的なメッセージングパターンを使うことができます。

同期通信。このパターンでは、サービスは、別のサービスによって公開されている API を、HTTP や gRPC などのプロトコルを使って呼び出します。このオプションは、呼び出し元が受信側からの応答を待機するため、同期メッセージングパターンです。
非同期のメッセージ受け渡し。このパターンでは、サービスは応答を待たずにメッセージを送信し、1 つまたは複数のサービスがメッセージを非同期的に処理します。

非同期 I/O と非同期プロトコルを区別することが重要です。非同期 I/O とは、I/O が実行されている間、呼び出し元のスレッドがブロックされないことを意味します。非同期 I/O はパフォーマンスにとって重要ですが、実装の詳細はアーキテクチャに関係します。非同期プロトコルとは、送信側が応答を待機しないことを意味します。 HTTP クライアントは要求を送信するときに非同期 I/O を使うことができたとしても、HTTP は同期プロトコルです。

各パターンにはトレードオフがあります。要求/応答はよく知られたパラダイムであるため、API の設計の方が、メッセージングシステムの設計より自然に感じられるかもしれません。しかし、非同期メッセージングには、マイクロサービスアーキテクチャで役に立つ利点がいくつかあります。

低い結合性。メッセージの送信側は、コンシューマーについて知っている必要はありません。
複数のサブスクライバー。パブリッシュ/サブスクライブモデルを使うと、複数のコンシューマーがイベントの受信をサブスクライブできます。「イベントドリブンアーキテクチャのスタイル」をご覧ください。
障害の分離。コンシューマーで障害が発生した場合でも、送信側はメッセージを送信できます。メッセージは、コンシューマーが復旧すると取得されます。各サービスが独自のライフサイクルを持つマイクロサービスアーキテクチャでは、この機能が特に役に立ちます。サービスがいつ使用不能になっても、またはサービスをいつ新しいバージョンに置き換えても、問題はありません。非同期メッセージングは、断続的なダウンタイムを処理できます。一方、同期 API では、ダウンストリームサービスが使用可能である必要があり、使用できないと操作は失敗します。
応答性。アップストリームのサービスは、ダウンストリームのサービスを待つ必要がなければ、より速く応答できます。これは、マイクロサービスアーキテクチャで特に役に立ちます。サービスの依存関係が連鎖している場合 (たとえば、サービス A が B を呼び出し、B が C を呼び出している場合)、同期呼び出しでの待機により待機時間が許容できないほど長くなる可能性があります。
負荷平準化。キューは、受信側が独自の速度でメッセージを処理できるように、ワークロードを平準化するためのバッファーとして機能できます。
ワークフロー。キューを使うと、ワークフローの各ステップの後にメッセージのチェックポイントを設けることで、ワークフローを管理できます。

ただし、非同期メッセージングを効果的に使うためには、いくつかの課題もあります。

メッセージングインフラストラクチャとの結合。特定のメッセージングインフラストラクチャを使うと、そのインフラストラクチャとの間に密接な結合が発生する可能性があります。その場合、後で別のメッセージングインフラストラクチャに切り替えるのが困難になります。
待機時間。メッセージキューがいっぱいになった場合、操作のエンドツーエンドの待機時間が長くなる可能性があります。
コスト。スループットを高くすると、メッセージングインフラストラクチャの金銭的コストが大きくなることがあります。
複雑さ。非同期メッセージングの処理は、簡単なタスクではありません。たとえば、メッセージの重複は、重複除去を行うか、または操作をべき等にすることによって、処理する必要があります。また、非同期メッセージングを使って要求/応答のセマンティクスを実装するのは困難です。応答を送信するには、別のキューに加えて、要求メッセージと応答メッセージを関連付ける手段が必要です。
スループット。メッセージで "キューセマンティクス" が必要な場合は、キューがシステムのボトルネックになる可能性があります。メッセージごとに、少なくとも 1 つのキュー操作と 1 つのデキュー操作が必要です。さらに、キューセマンティクスでは、一般に、メッセージングインフラストラクチャ内に何らかの種類のロックが必要になります。キューが管理されたサービスの場合は、キューがクラスターの仮想ネットワークの外部にあるため、待機時間が増える可能性があります。これらの問題はメッセージをバッチ処理することで軽減されますが、コードは複雑になります。メッセージにキューセマンティクスが必要ない場合は、キューの代わりにイベント "ストリーム" を使うことができる場合があります。詳しくは、「イベントドリブンアーキテクチャのスタイル」をご覧ください。

ドローン配送:メッセージングパターンの選択

このソリューションでは、ドローン配送の例を使用します。これは、航空宇宙と航空機の業界に最適です。

以上の考慮事項を念頭に置き、開発チームではドローン配送アプリケーションの設計に関して次のような選択が行われました。

インジェストサービスでは、クライアントアプリケーションが配送のスケジュール、更新、キャンセルに使うことができるパブリック REST API を公開します。
インジェストサービスは、Event Hubs を使って、Scheduler サービスに非同期メッセージを送信します。インジェストに必要な負荷平準化を実装するには、非同期メッセージが必要です。
アカウント、配送、パッケージ、ドローン、サードパーティトランスポートの各サービスはすべて、内部 REST API を公開します。 Scheduler サービスは、これらの API を呼び出してユーザーの要求を実行します。同期 API を使う理由の 1 つは、Scheduler は各ダウンストリームサービスから応答を取得する必要があるためです。いずれかのダウンストリームサービスでの障害は、操作全体が失敗することを意味します。ただし、バックエンドサービスを呼び出すことによってもたらされる待機時間の大きさという潜在的な問題があります。
いずれかのダウンストリームサービスで一時的ではないエラーが発生した場合は、トランザクション全体を失敗としてマークする必要があります。このような場合に対処するため、Scheduler サービスはスーパーバイザーに非同期メッセージを送信し、スーパーバイザーが補正トランザクションをスケジュールできるようにします。
配送サービスによって公開されるパブリック API を使うことで、クライアントは配送の状態を取得できます。 API ゲートウェイに関する記事では、どの API がどのサービスによって公開されているのかをクライアントが知らなくてもいいように、API ゲートウェイが基になるサービスをクライアントから隠ぺいする方法が説明されています。
ドローンの飛行中、ドローンサービスはドローンの現在の場所と状態を含むイベントを送信します。配送サービスはこれらのイベントをリッスンして、配送の状態を追跡します。
配送の状態が変化すると、配送サービスは DeliveryCreated や DeliveryCompleted などの配送状態イベントを送信します。どのサービスでもこれらのイベントをサブスクライブできます。現在の設計では配送履歴サービスが唯一のサブスクライバーですが、後で他のサブスクライバーが追加される可能性があります。たとえば、イベントがリアルタイム分析サービスに送られるかもしれません。また、Scheduler は応答を待つ必要がないため、サブスクライバーが追加されてもワークフローのメインのパスに影響はありません。

ドローン通信の図

配送状態イベントはドローンの場所のイベントから派生することに注意してください。たとえば、ドローンが配送先に着いてパッケージをドロップすると、配送サービスはこれを DeliveryCompleted イベントに変換します。これは、ドメインモデルの観点から考える場合の例です。前に説明したように、ドローン管理は境界が異なるコンテキストに属しています。ドローンイベントは、ドローンの物理的な場所を伝達します。一方、配送イベントは配送状態の変化を表し、これは異なるビジネスエンティティです。

サービスメッシュの使用

"サービスメッシュ" は、サービス間通信を処理するソフトウェアレイヤーです。サービスメッシュは、前のセクションで挙げた問題の多くに対処し、これらの問題に対する責任をマイクロサービス自体から共有レイヤーに移すように設計されています。サービスメッシュは、クラスター内のマイクロサービス間のネットワーク通信をインターセプトするプロキシとして機能します。現時点では、サービスメッシュの概念は、サーバーレスアーキテクチャではなく、コンテナーオーケストレーターに主に適用されます。

注意

サービスメッシュはアンバサダーパターンの例であり、アプリケーションに代わってネットワーク要求を送信するヘルパーサービスです。

現在、Kubernetes で利用できるサービスメッシュのオプションは、主に Linkerd と Istio です。どちらのテクノロジも急速に発展しています。ただし、Linkerd と Istio のどちらにも次のような機能が共通して含まれます。

検出された待機時間または未処理の要求の数に基づく、セッションレベルでの負荷分散。これにより、Kubernetes によって提供されるレイヤー 4 の負荷分散のパフォーマンスが向上します。
URL パス、ホストヘッダー、API のバージョン、または他のアプリケーションレベルのルールに基づく、レイヤー 7 のルーティング。
失敗した要求の再試行。サービスメッシュは HTTP のエラーコードを認識し、失敗した要求を自動的に再試行できます。ユーザーは、再試行の最大回数とタイムアウト時間を構成して、最大待機時間を制限することができます。
サーキットブレーク。インスタンスで要求が常に失敗する場合、サービスメッシュはそのインスタンスを一時的に利用不可としてマークします。バックオフ期間の後、サービスメッシュはそのインスタンスを再び試みます。連続した障害の数など、さまざまな条件に基づいてサーキットブレーカーを構成できます。
サービスメッシュは、要求の量、待機時間、エラー率と成功率、応答のサイズなど、サービス間呼び出しに関するメトリックをキャプチャします。サービスメッシュでは、要求内の各ホップの相関関係情報を追加することで分散トレースも可能です。
サービス間呼び出しに対する相互 TLS 認証。

サービスメッシュが必要だとお考えですか。一概には言えません。サービスメッシュがない場合は、この記事の最初で説明した各課題をユーザー自身が考慮する必要があります。サービスメッシュがなくても再試行、サーキットブレーカー、分散トレースなどの問題を解決することはできますが、サービスメッシュはこれらの問題を個々のサービスから専用のレイヤーに移してくれます。一方、サービスメッシュがあると、クラスターの設定と構成が複雑になります。要求はサービスメッシュプロキシを通してルーティングされるようになり、クラスターの各ノードで実行されるサービスが増えるので、パフォーマンスに影響する可能性があります。運用環境にサービスメッシュを展開する前に、パフォーマンスと負荷のテストを徹底的に行う必要があります。

分散トランザクション

マイクロサービスにおける一般的な課題は、複数のサービスにまたがるトランザクションを正しく処理することです。多くの場合、トランザクションはすべて成功するか、すべて失敗するかのどちらかです。参加しているサービスの 1 つがエラーになると、トランザクション全体がエラーになります。

考慮すべきケースが 2 つあります。

サービスで、ネットワークタイムアウトなどの一時的なエラーが発生している可能性があります。多くの場合、これらのエラーは呼び出しを再試行するだけで解決できます。一定回数やり直した後も操作がまだ失敗する場合は、一時的でないエラーと見なされます。
一時的でないエラーとは、自然には解消されない可能性の高いエラーです。一時的でないエラーには、無効な入力などの通常のエラー条件が含まれます。アプリケーションコードのハンドルされない例外やプロセスのクラッシュも含まれます。この種類のエラーが発生した場合は、ビジネストランザクション全体をエラーとしてマークする必要があります。既に成功した同じトランザクションの他のステップを元に戻すことが必要な場合があります。

一時的でないエラーが発生した後、現在のトランザクションは、1 つ以上のステップが既に正常に完了している "部分的に失敗" の状態になっている可能性があります。たとえば、ドローンサービスがドローンを既にスケジュールしている場合は、ドローンをキャンセルする必要があります。その場合、アプリケーションは補正トランザクションを使って成功したステップを元に戻す必要があります。場合によっては、このアクションは外部システムまたは手動プロセスで行う必要があります。設計では、補正メジャーも障害の影響を受けることに注意してください。

補正トランザクションのロジックが複雑な場合は、このプロセスを担当する別のサービスを作成することを検討します。ドローン配信アプリケーションでは、Scheduler サービスは失敗した操作を専用のキューに格納します。 Supervisor と呼ばれる独立したマイクロサービスは、このキューから読み取り、補正が必要なサービスに対してキャンセル API を呼び出します。これは Scheduler Agent Supervisor パターンのバリエーションです。 Supervisor サービスは、テキストまたは電子メールによるユーザーへの通知や操作ダッシュボードへのアラートの送信などの他の操作も実行できます。

Supervisor マイクロサービスを示す図

(たとえば、ノードのクラッシュが原因で) Scheduler サービス自体が失敗する可能性があります。その場合は、新しいインスタンスが起動して引き継ぎます。ただし、既に進行中のトランザクションを再開する必要があります。

1 つの方法は、ワークフローの各ステップが完了した後にチェックポイントを Durable store に保存することです。 Scheduler サービスのインスタンスがトランザクションの途中でクラッシュした場合、新しいインスタンスはチェックポイントを使用して前のインスタンスが中断したところから再開できます。ただし、チェックポイントを作成すると、パフォーマンスのオーバーヘッドが発生する可能性があります。

もう 1 つの方法は、すべての操作をべき等となるように設計することです。操作は、最初の呼び出しの後に複数回呼び出しても副次的な影響が生じない場合はべき等です。基本的に、ダウンストリームサービスは重複呼び出しを無視します。つまり、サービスは重複呼び出しを検出できなければなりません。べき等メソッドを実装するのは常に簡単であるとは限りません。詳細については、べき等操作に関するページを参照してください。

次のステップ

互いに直接通信するマイクロサービスの場合、適切に設計された API を作成することが重要です。

API 設計

次の方法で共有

マイクロサービスのサービス間通信の設計

課題

同期メッセージングと非同期メッセージング

ドローン配送:メッセージングパターンの選択

サービスメッシュの使用

分散トランザクション

次のステップ

フィードバック

その他のリソース

次の方法で共有

マイクロサービスのサービス間通信の設計

課題

同期メッセージングと非同期メッセージング

ドローン配送:メッセージング パターンの選択

サービス メッシュの使用

分散トランザクション

次のステップ

関連リソース

フィードバック

その他のリソース

ドローン配送:メッセージングパターンの選択

サービスメッシュの使用