建立資料驅動的原則並影響決策制訂

機器學習模型在識別資料中的模式和預測方面成效顯著。 不過對於在干預情況下預估真實結果如何改變,則效果不彰。

從業者逐漸聚焦於使用歷史資料來告知其未來的決策和商務干預。 例如,如果公司追求新的定價策略,對營收有何影響? 在所有其他情況都相同的情況下,新藥物是否可改善病患的狀況?

負責任 AI 儀表板的「因果推斷」元件藉由估計特徵對平均利益成果、跨人口或世代和個人層級的效果,來解決這些問題。 其也有助於建構有作為的干預,方法是模擬對各種干預的特徵回應,並建立規則來判斷哪些人口世代可從干預獲益。 整體上,這些功能可讓決策者套用新的原則,並影響真實世界的變更。

此元件的功能來自 EconML 套件。 它會透過雙機器學習技術,從觀察資料預估異質處理效果。

當您需要執行下列項目時,請使用因果推斷:

  • 找出對您利益成果有最直接效果的特徵。
  • 決定要採取什麼整體處理原則,以將對利益成果的真實世界影響最大化。
  • 了解具有特定特徵值的個人如何回應特定處理原則。

如何產生因果推斷深入解析?

注意

要產生因果深入解析只需要歷史資料。 根據處理特徵計算的因果效果純粹是資料屬性。 因此,計算因果效果時,定型的模型是選用的。

雙機器學習是在觀察到所有可能的干擾因子/控制因素 (同時對所收集資料和觀察到成果的處理決策有直接影響的因素),但出現下列任一項問題時,用於評估異質處理效果的一種方法:

  • 對傳統統計方法而言,可能太多而無法適用。 也就是高維度
  • 其對處理和成果的影響無法透過參數化函式來滿意地重構模型。 也就是非參數

您可以使用機器學習技術來解決這兩個問題。 例如,請參閱 Chernozhukov2016

雙機器學習會先預估兩個預測性工作,以減少問題:

  • 從控制因素預測成果
  • 從控制因素預測處理

然後,方法會在最終階段估計中結合這兩個預測模型,以建立異質性處理效果的模型。 此方法可讓任意機器學習演算法用於這兩個預測性工作,同時保有許多有利於最終模型相關的統計屬性。 這些屬性包括小型平均平方誤差、漸進常態以及建構信賴區間。

Microsoft 為因果推斷提供哪些其他工具?

  • Project Azua 提供聚焦於端對端因果推斷的新穎架構。

    Azua 的 DECI (深度端對端因果推斷) 技術是單一模型,可以同時執行因果探索和因果推斷。 使用者提供資料,然後模型可以輸出所有變數之間的因果關聯性。

    這種方法本身可以為資料提供深入解析。 而且能夠計算個別處理效果 (ITE)、平均處理效果 (ATE) 以及條件式平均處理效果 (CATE) 等計量。 然後,您可以使用這些計算結果來做出最佳決策。

    此架構可針對變數數量和資料點數量等大型資料調整。 也可以處理混合統計類型的遺漏資料項目。

  • EconML 可支援負責任 AI 儀表板因果推斷元件的後端作業。 它是一種 Python 套件,套用機器學習技術來估計來自觀察或實驗性資料的個別化因果回應。

    EconML 中的估計方法套件代表因果機器學習的最新進展。 藉由將個別機器學習步驟納入可解譯的因果模型,這些方法可改善假設狀況預測的可靠性,並讓一組廣泛的使用者更快速且更輕鬆地進行因果分析。

  • DoWhy 是一個 Python 程式庫,旨在激發因果思考和分析。 DoWhy 為因果推斷提供準則化的四步驟介面,聚焦於明確建立因果假設的模型,並盡可能驗證它們。

    DoWhy 的主要特色在於其最先進的反駁 API,可自動測試任何估計方法的因果假設, 使得推斷更健全,且更適合非專業人士使用。

    DoWhy 支援對後端、前端、檢測變數和其他識別方法的平均因果影響估計。 也透過與 EconML 程式庫的整合來估計 CATE。

下一步