Megosztás a következőn keresztül:


Adatvezérelt szabályzatok létrehozása és a döntéshozatal befolyásolás

A gépi tanulási modellek hatékonyak az adatok mintáinak azonosításában és az előrejelzések készítésében. De kevés támogatást nyújtanak annak becsléséhez, hogy a valós eredmény hogyan változik egy beavatkozás jelenlétében.

A szakemberek egyre inkább a korábbi adatok felhasználására összpontosítanak jövőbeli döntéseik és üzleti beavatkozásaik tájékoztatására. Hogyan befolyásolná például a bevételt, ha egy vállalat új díjszabási stratégiát követne? Egy új gyógyszer javítaná a beteg állapotát, minden más egyenlő?

A Felelős AI-irányítópult oksági következtetési összetevője ezeket a kérdéseket azzal oldja meg, hogy megbecsüli egy funkció hatását egy érdeklődési eredményre átlagosan, egy populáció vagy egy kohorsz esetében, valamint egyéni szinten. Emellett segít az ígéretes beavatkozások kialakításában azáltal, hogy szimulálja a különböző beavatkozásokra adott jellemző válaszokat, és szabályokat hoz létre annak meghatározására, hogy mely populációk kohorszai profitálnának egy beavatkozásból. Ezek a funkciók együttesen lehetővé teszik a döntéshozók számára, hogy új politikákat alkalmazzanak, és valós változásokat ösztönözhessenek.

Az összetevő képességei az EconML-csomagból származnak. A kettős gépi tanulási technikán keresztül a megfigyelési adatok heterogén kezelési hatásait becsüli meg.

Használjon ok-okozati következtetést, ha a következőkre van szüksége:

  • Azonosítsa azokat a funkciókat, amelyek a legközvetebb hatással vannak az Érdeklődési Kör eredményére.
  • Döntse el, hogy milyen általános kezelési szabályzatot kell figyelembe vennie, hogy maximalizálja a valós hatást egy érdekes eredményre.
  • Ismerje meg, hogy a bizonyos jellemzőértékekkel rendelkező személyek hogyan reagálnának egy adott kezelési szabályzatra.

Hogyan jönnek létre oksági következtetési megállapítások?

Feljegyzés

Az ok-okozati elemzések létrehozásához csak előzményadatok szükségesek. A kezelési jellemzők alapján kiszámított ok-okozati hatások kizárólag adattulajdonságok. A betanított modell tehát nem kötelező, ha az ok-okozati hatásokat számítja ki.

A kettős gépi tanulás a heterogén kezelési hatások becslésére szolgáló módszer, ha minden lehetséges zavaró tényezőt/kontrollt (azokat a tényezőket, amelyek egyidejűleg közvetlen hatással voltak a kezelési döntésre az összegyűjtött adatokban és a megfigyelt eredményben) megfigyelik, de az alábbi problémák valamelyike fennáll:

  • Túl sok a klasszikus statisztikai megközelítés ahhoz, hogy alkalmazható legyen. Vagyis nagy dimenziójúak.
  • A kezelésre és az eredményre gyakorolt hatásuk nem modellezheti kielégítően a parametrikus függvényekkel. Vagyis nem parametrikusak.

Mindkét probléma megoldásához gépi tanulási technikákat használhat. Példa: Chernozhukov2016.

A dupla gépi tanulás két prediktív feladat becslésével csökkenti a problémát:

  • A vezérlők eredményének előrejelzése
  • A kezelés előrejelzése a vezérlőkből

Ezután a módszer ezt a két prediktív modellt egy végső fázisú becslésben egyesíti a heterogén kezelési hatás modelljének létrehozásához. Ez a megközelítés lehetővé teszi, hogy tetszőleges gépi tanulási algoritmusokat használjon a két prediktív feladathoz, miközben számos, a végső modellhez kapcsolódó kedvező statisztikai tulajdonságot tart fenn. Ezek a tulajdonságok közé tartozik a kis átlagos négyzetes hiba, az aszimptotikus normalitás és a megbízhatósági intervallumok felépítése.

Milyen egyéb eszközöket biztosít a Microsoft az ok-okozati következtetéshez?

  • A Project Azua egy új keretrendszert biztosít, amely a végpontok közötti ok-okozati következtetésre összpontosít.

    Az azua DECI (deep end-to-end causal inference) technológiája egyetlen modell, amely egyidejűleg képes okozati felderítésre és ok-okozati következtetésre. A felhasználó adatokat ad meg, és a modell az oksági kapcsolatokat az összes változó között ki tudja adni.

    Ez a megközelítés önmagában is betekintést nyújt az adatokba. Lehetővé teszi olyan metrikák kiszámítását, mint az egyéni kezelési hatás (ITE), az átlagos kezelési hatás (ATE) és a feltételes átlagos kezelési hatás (CATE). Ezeket a számításokat ezután az optimális döntések meghozatalához használhatja.

    A keretrendszer méretezhető a nagy méretű adatok esetében, mind a változók száma, mind az adatpontok száma szempontjából. A hiányzó adatbejegyzéseket vegyes statisztikai típusokkal is képes kezelni.

  • Az EconML a Felelős AI-irányítópult ok-okozati következtetési összetevőjének háttérrendszerét működteti. Ez egy Python-csomag, amely gépi tanulási technikákat alkalmaz a megfigyelési vagy kísérleti adatokból származó egyéni ok-okozati válaszok becslésére.

    Az EconML becslési módszereinek csomagja az ok-okozati gépi tanulás legújabb előrelépéseit mutatja be. Az egyes gépi tanulási lépések értelmezhető ok-okozati modellekbe való beépítésével ezek a módszerek javítják a mi-ha előrejelzések megbízhatóságát, és gyorsabbá és egyszerűbbé teszik az ok-okozati elemzést a felhasználók széles köre számára.

  • A DoWhy egy Python-kódtár, amelynek célja az ok-okozati gondolkodás és az elemzés. A DoWhy egy elvi négylépéses felületet biztosít az ok-okozati következtetéshez, amely az okozati feltételezések explicit modellezésére és a lehető legnagyobb mértékű érvényesítésére összpontosít.

    A DoWhy fő funkciója a legkorszerűbb cáfolási API, amely automatikusan képes bármilyen becslési módszer okozati feltételezéseinek tesztelésére. A következtetés robusztusabbá és akadálymentesebbé teszi a nem szakértők számára.

    A DoWhy támogatja a hátsó ajtó, a bejárati ajtó, a műszeres változó és más azonosítási módszerek átlagos oksági hatásának becslését. Emellett támogatja a CATE becslését az EconML-kódtárral való integráció révén.

Következő lépések