Share via


データドリブン ポリシーを作成し、意思決定に影響を与える

機械学習モデルは、データ パターンを識別したり、予測を行ったりすることにおいて力を発揮します。 しかし、介入が存在する場合に実際の結果がどのように変化するかを推定するためのサポートはほとんど提供されていません。

専門家は、履歴データを使用して将来の意思決定やビジネスの介入を通知することにますます焦点を当てるようになってきています。 たとえば、企業が新しい価格戦略を追求した場合、収益にはどのような影響があるでしょうか? 他の条件がすべて等しいとした場合、新しい薬によって患者の状態は改善されるでしょうか?

責任ある AI ダッシュボードの "因果推論" コンポーネントは、ある母集団 (コーホート) 全体、および個人レベルにおいて、平均的な関心の結果に対する特徴の効果を推定することによって、これらの質問に対応します。 また、さまざまな介入に対する特徴反応をシミュレートし、ある介入の恩恵を受ける母集団コーホートを判断するルールを作成することで、有望な介入を構築するのにも役立ちます。 これらの機能を集合的に使用することで、意思決定者は新しいポリシーを適用し、実際の変化を促進することができます。

このコンポーネントの機能は EconML パッケージから提供されます。 このパッケージは、Double Machine Learning 技術を通じて観測データから異種処理効果を推定します。

次を行う必要がある場合は、因果推論を使用します。

  • 関心の結果に対して最も直接的効果を持つ特徴を識別する。
  • 関心の結果に対する実際の影響を最大化するために取るべき全体的な処置ポリシーを決定する。
  • 特定の特徴の値を持つ個人が特定の処置ポリシーに対してどのように反応するかを理解する。

因果推論の分析情報はどのように生成されますか?

注意

因果分析情報の生成に必要なものは履歴データのみです。 処置の特徴に基づいて計算される因果効果は、純粋にデータ プロパティです。 そのため、因果効果を計算する場合、トレーニング済みモデルは省略可能です。

Double Machine Learning とは、すべての潜在的な交絡因子/コントロール (収集されたデータと観察された結果における処置の意思決定に対して直接的効果を同時に持っていた要因) が観察されるが、次のいずれかの問題が存在する場合に、異種性が存在する処置効果を推定するための方法です。

  • 従来の統計的アプローチを適用するには数が多すぎる。 つまり、"高次元" である。
  • 処置と結果に対するそれらの影響をパラメトリック関数によって十分にモデル化できない。 つまり、"非パラメトリック" である。

機械学習の手法を使用して両方の問題に対処できます。 たとえば、Chernozhukov2016 を参照してください。

Double Machine Learning では、最初に次の 2 つの予測タスクを推定することによって問題が削減されます。

  • コントロールから結果を予測する
  • コントロールから処置を予測する

次に、この方法では、これら 2 つの予測モデルを最終段階の推定で組み合わせて、異種性が存在する処置効果のモデルが作成されます。 このアプローチを使用すると、最終モデルに関連する多くの好ましい統計的特性を維持しながら、2 つの予測タスクに任意の機械学習アルゴリズムを使用できます。 これらの特性には、小さな平均二乗誤差、漸近正規性、信頼区間の構築が含まれます。

Microsoft では因果推論に対して他にどのようなツールを提供していますか?

  • Project Azua では、エンド ツー エンドの因果推論に焦点を当てた新しいフレームワークを用意しています。

    Azua の DECI (deep end-to-end causal inference: ディープ エンドツーエンド因果推論) 技術は、因果関係の発見と因果推論を同時に行うことができる単一のモデルです。 ユーザーはデータを提供し、このモデルですべての変数間の因果関係を出力できます。

    このアプローチ自体が、データに関する分析情報を提供できます。 これにより、Individual Treatment Effect (ITE: 個々の処置効果)、Average Treatment Effect (ATE: 平均処置効果)、Conditional Average Treatment Effect (CATE: 条件付き平均処置効果) などのメトリックの計算が可能になります。 そして、これらの計算を使用して最適な意思決定を行うことができます。

    このフレームワークは、変数の数とデータ ポイント数の両方の観点から、大規模なデータ用に拡張可能です。 また、統計の種類が混在するデータ エントリの欠落も処理できます。

  • EconML は、責任ある AI ダッシュボードの因果推論コンポーネントのバックエンドを作動させます。 これは、機械学習手法の能力を適用して、観測または実験データから個々の因果反応を推定する Python パッケージです。

    EconML の一連の推定方法は、因果機械学習の最新の進歩を表しています。 これらの方法では、個々の機械学習手順を解釈可能な因果モデルに組み込むことによって、what-if 予測の信頼性が向上し、また、幅広いユーザーにとって因果分析が迅速かつ簡単になります。

  • DoWhy は、因果に関する意見と分析を活発にすることを目的とした Python ライブラリです。 DoWhy には、因果の仮定を明示的にモデル化し、それらを可能な限り検証することに焦点を当てた、因果推論を実行するための、原則に基づいた 4 ステップ インターフェイスが用意されています。

    DoWhy の主な機能は、あらゆる推定方法に対して因果の仮定を自動的にテストできる最先端の反論 API です。 これにより、推論をより堅牢なものにし、専門家以外の人も利用しやすくなります。

    DoWhy では、バックドア、フロントドア、操作変数、その他の識別方法の平均因果効果の推定がサポートされています。 また、EconML ライブラリとの統合による CATE の推定もサポートされます。

次のステップ