Membuat kebijakan berbasis data dan memengaruhi pengambilan keputusan

Model pembelajaran mesin sangat kuat dalam mengidentifikasi pola dalam data dan membuat prediksi. Tetapi mereka menawarkan sedikit dukungan untuk memperkirakan bagaimana hasil dunia nyata berubah di hadapan intervensi.

Praktisi telah semakin fokus menggunakan data historis untuk menginformasikan keputusan masa depan dan intervensi bisnis mereka. Misalnya, bagaimana pendapatan akan terpengaruh jika perusahaan mengejar strategi harga baru? Apakah obat baru akan meningkatkan kondisi pasien, semua sama?

Komponen inferensi kausal dasbor AI bertanggung jawab membahas pertanyaan-pertanyaan ini dengan memperkirakan efek fitur pada hasil minat rata-rata, di seluruh populasi atau kohor, dan pada tingkat individu. Ini juga membantu membangun intervensi yang menjanjikan dengan mensimulasikan respons fitur terhadap berbagai intervensi dan membuat aturan untuk menentukan kohor populasi mana yang akan mendapat manfaat dari intervensi. Secara kolektif, fungsionalitas ini memungkinkan pembuat keputusan untuk menerapkan kebijakan baru dan mendorong perubahan dunia nyata.

Kemampuan komponen ini berasal dari paket EconML . Ini memperkirakan efek perawatan heterogen dari data pengamatan melalui teknik pembelajaran mesin ganda.

Gunakan inferensi kausal saat Anda perlu:

  • Identifikasi fitur yang memiliki efek paling langsung pada hasil minat Anda.
  • Tentukan kebijakan perawatan keseluruhan apa yang harus diambil untuk memaksimalkan dampak dunia nyata pada hasil yang menarik.
  • Pahami bagaimana individu dengan nilai fitur tertentu akan merespons kebijakan perawatan tertentu.

Bagaimana wawasan inferensi kausal dihasilkan?

Catatan

Hanya data historis yang diperlukan untuk menghasilkan wawasan kausal. Efek penyebab yang dihitung berdasarkan fitur perawatan murni properti data. Jadi, model terlatih bersifat opsional saat Anda menghitung efek penyebabnya.

Pembelajaran mesin ganda adalah metode untuk memperkirakan efek perawatan heterogen ketika semua potensi confounder/kontrol (faktor-faktor yang secara bersamaan memiliki efek langsung pada keputusan pengobatan dalam data yang dikumpulkan dan hasil yang diamati) diamati tetapi salah satu masalah berikut ada:

  • Terlalu banyak pendekatan statistik klasik yang akan diterapkan. Artinya, mereka dimensi tinggi.
  • Efeknya pada perawatan dan hasil tidak dapat dimodelkan dengan memuaskan oleh fungsi parametrik. Artinya, mereka non-parametrik.

Anda dapat menggunakan teknik pembelajaran mesin untuk mengatasi kedua masalah tersebut. Misalnya, lihat Chernozhukov2016.

Pembelajaran mesin ganda mengurangi masalah dengan terlebih dahulu memperkirakan dua tugas prediktif:

  • Memprediksi hasil dari kontrol
  • Memprediksi perawatan dari kontrol

Kemudian metode menggabungkan kedua model prediktif ini dalam estimasi tahap akhir untuk membuat model efek perawatan heterogen. Pendekatan ini memungkinkan algoritma pembelajaran mesin arbitrer digunakan untuk dua tugas prediktif sambil mempertahankan banyak properti statistik yang menguntungkan yang terkait dengan model akhir. Properti ini termasuk kesalahan kuadrat rata-rata kecil, normalitas asimptotik, dan konstruksi interval keyakinan.

Alat lain apa yang disediakan Microsoft untuk inferensi kausal?

  • Project Azua menyediakan kerangka kerja baru yang berfokus pada inferensi kausal end-to-end.

    Teknologi DECI (inferensi kausal ujung-ke-ujung) Azua adalah model tunggal yang secara bersamaan dapat melakukan penemuan kausal dan inferensi penyebab. Pengguna menyediakan data, dan model dapat menghasilkan hubungan penyebab di antara semua variabel.

    Dengan sendirinya, pendekatan ini dapat memberikan wawasan tentang data. Ini memungkinkan perhitungan metrik seperti efek perawatan individu (ITE), efek perawatan rata-rata (ATE), dan efek perawatan rata-rata bersyarjana (CATE). Anda kemudian dapat menggunakan perhitungan ini untuk membuat keputusan yang optimal.

    Kerangka kerja dapat diskalakan untuk data besar, dalam hal jumlah variabel dan jumlah titik data. Ini juga dapat menangani entri data yang hilang dengan jenis statistik campuran.

  • EconML mendukung ujung belakang komponen inferensi kausal dasbor AI yang bertanggung jawab. Ini adalah paket Python yang menerapkan teknik pembelajaran mesin untuk memperkirakan respons penyebab individual dari data observasional atau eksperimental.

    Rangkaian metode estimasi di EconML mewakili kemajuan terbaru dalam pembelajaran mesin penyebab. Dengan menggabungkan langkah-langkah pembelajaran mesin individual ke dalam model kausal yang dapat ditafsirkan, metode ini meningkatkan keandalan prediksi bagaimana-jika dan membuat analisis kausal lebih cepat dan lebih mudah untuk sekumpulan pengguna yang luas.

  • DoWhy adalah pustaka Python yang bertujuan untuk memicu pemikiran dan analisis kausal. DoWhy menyediakan antarmuka empat langkah berprinsip untuk inferensi kausal yang berfokus pada pemodelan asumsi penyebab secara eksplisit dan memvalidasinya sebanyak mungkin.

    Fitur utama DoWhy adalah API refutation state-of-the-art yang dapat secara otomatis menguji asumsi kausal untuk metode estimasi apa pun. Ini membuat inferensi lebih kuat dan dapat diakses oleh non-ahli.

    DoWhy mendukung estimasi efek penyebab rata-rata untuk pintu belakang, pintu depan, variabel instrumental, dan metode identifikasi lainnya. Ini juga mendukung estimasi CATE melalui integrasi dengan pustaka EconML.

Langkah berikutnya