反事實分析和假設

假設狀況反事實可解決模型在您已變更動作輸入時所預測的問題。 其可讓您針對機器學習模型對輸入 (功能) 變更的反應方式,對其進行了解和偵錯。

標準解譯性技術會根據其預測重要性來估計機器學習模型或排名特徵。 相反地,反事實分析會「詢問」模型來判斷特定資料點的變更會翻轉模型決策。

這類分析有助於解開隔離中相互關聯功能的影響。 其也協助您取得更細微的了解,以辨明需要多少功能變更才能查看分類模型的模型決策翻轉,以及迴歸模型的決策變更。

負責任 AI 儀表板的「反事實分析和假設」元件具有兩項功能:

  • 產生一組對特定點進行最少變更的範例,使其變更模型的預測 (顯示具有相反模型預測的最接近資料點)。
  • 讓使用者產生自己的假設擾動,以了解模型如何回應功能的變更。

負責任 AI 儀表板反事實分析元件的其中一個最上層優點在於,您可以識別有所差異的功能,以及其有效和邏輯反事實範例的允許範圍。

此元件的功能來自 DiCE 套件。

當您需要進行下列作業時,請使用假設狀況反事實:

  • 擾動性別和種族這類敏感性屬性,然後觀察模型預測試是否變更,以檢查作為決策評估工具的公平性和可靠性準則。
  • 深入偵錯特定輸入執行個體。
  • 將解決方案提供給使用者,並判斷他們可以做什麼,以從模型取得所需的結果。

如何產生反事實範例?

為了產生反事實,DiCE 會實作一些與模型無關的技術。 這些方法適用於任何不透明方塊分類器或迴歸輸入變數。 這些方法是以取樣輸入點的鄰近點為基礎,同時根據鄰近性 (和選擇性地根據疏疏性、多樣性和可行性) 最佳化遺失函式。 目前支援的方法如下:

  • 隨機搜尋:此方法會隨機取樣查詢點附近的點,並傳回反事實,如其預測標籤為所需類別的點一樣。
  • 基因搜尋:此方法使用基因演算法來取樣點,根據最佳化與查詢點的鄰近性結合目標、盡量減少變更功能,以及尋求所產生反事實之間的多樣性。
  • KD 樹狀結構搜尋:此演算法會從定型資料集傳回反事實。 其會根據距離函數,在定型資料點上建構 KD 樹狀結構,然後將最接近的點傳回給產生所需預測標籤的特定查詢點。

下一步