Принятие политик на основе данных и влияние принятия решений

Модели машинного обучения эффективны при определении шаблонов в данных и прогнозировании. Но они предлагают мало поддержки для оценки того, как реальные результаты изменяются в присутствии вмешательства.

Практики все больше внимания уделяют использованию исторических данных для обоснования своих будущих решений и бизнес-вмешательств. Например, как будет влиять доход, если корпорация преследовала новую стратегию ценообразования? Будет ли новое лекарство улучшить состояние пациента, все остальное равно?

Компонент причинного выводапанели мониторинга ответственного искусственного интеллекта решает эти вопросы, оценивая влияние функции на результат интереса в среднем по всей совокупности или когорте, а также на индивидуальном уровне. Она также помогает создавать перспективные вмешательства путем имитации ответов признаков на различные вмешательства и создания правил, чтобы определить, какие когорты населения будут воспользоваться вмешательством. В совокупности эти функции позволяют лицам, принимающим решения, применять новые политики и вносить реальные изменения.

Возможности этого компонента исходят из пакета EconML . Он оценивает разнородные эффекты лечения от наблюдений данных с помощью метода двойного машинного обучения .

Используйте причинное вывод, если необходимо:

  • Определите функции, которые оказывают самое прямое влияние на интересующий вас результат.
  • Решите, какую общую политику обработки следует использовать, чтобы максимизировать реальное влияние на интересующий результат.
  • Узнайте, как люди с определенными значениями признаков будут реагировать на определенную политику обработки.

Как создаются аналитические сведения о причинном выводе?

Примечание.

Для создания причинной аналитики требуются только исторические данные. Причинно-следственные эффекты, вычисляемые на основе функций лечения, являются исключительно свойством данных. Таким образом, обученная модель необязательна при вычислении причинных эффектов.

Двойное машинное обучение — это метод оценки разнородных эффектов лечения, когда наблюдаются все потенциальные конфаундеры и элементы управления (факторы, которые одновременно оказывают непосредственное влияние на решение лечения в собранных данных и наблюдаемом результате), но любой из следующих проблем существует:

  • Для применения классических статистических подходов слишком много. То есть они многомерные.
  • Их влияние на лечение и результат нельзя удовлетворительно моделировать с помощью параметрических функций. То есть они непараметрические.

Для решения обеих проблем можно использовать методы машинного обучения. Пример см. в разделе "Черножуков2016".

Двойное машинное обучение сокращает проблему, сначала оценивая две прогнозные задачи:

  • прогнозирование результатов на основе элементов управления;
  • прогнозирование обработки на основе элементов управления.

Затем метод объединяет эти две прогнозные модели в окончательной оценке, чтобы создать модель разнородного эффекта лечения. Этот подход позволяет использовать произвольные алгоритмы машинного обучения для двух прогнозных задач при сохранении множества благоприятных статистических свойств, связанных с конечной моделью. К этим свойствам относятся небольшая средняя квадратная ошибка, асимтотическая нормализация и построение доверительных интервалов.

Какие другие средства корпорация Майкрософт предоставляет для причинного вывода?

  • Project Azua предоставляет новую платформу, которая фокусируется на сквозном выводе причин.

    Технология DECI Azua (глубокая сквозная выводная вывод) является одной моделью, которая может одновременно выполнять причинное обнаружение и вывод причин. Пользователь предоставляет данные, и модель может выводить причинные связи между всеми переменными.

    По себе этот подход может предоставить аналитические сведения о данных. Он позволяет вычислять метрики, такие как отдельный эффект лечения (ITE), средний эффект лечения (ATE), а также условный средний эффект лечения (CATE). Затем эти вычисления можно использовать для принятия оптимальных решений.

    Платформа масштабируется для больших данных с точки зрения количества переменных и количества точек данных. Он также может обрабатывать отсутствующие записи данных с смешанными статистическими типами.

  • EconML управляет внутренней частью компонента причинного вывода панели мониторинга ответственного искусственного интеллекта. Это пакет Python, который применяет методы машинного обучения для оценки отдельных причинных ответов от наблюдений или экспериментальных данных.

    Набор методов оценки в EconML представляет последние достижения в причинном машинном обучении. Включая отдельные этапы машинного обучения в интерпретируемые причинно-следственные модели, эти методы повышают надежность прогнозов "что, если", а также упрощают и ускоряют причинно-следственный анализ для широкого круга пользователей.

  • DoWhy — это библиотека Python, задачей которой является развитие причинно-следственного мышления и анализа. DoWhy предоставляет обоснованный четырехэтапный интерфейс для причинного вывода, который фокусируется на явном моделировании причинно-следственных предположений и их максимально возможной проверке.

    Ключевой особенностью DoWhy является его интерфейс API опровержения, который может автоматически тестировать причинные предположения для любого метода оценки. Это делает вывод более надежным и доступным для не-экспертов.

    DoWhy поддерживает оценку среднего причинного эффекта для задней двери, передней двери, инструментальной переменной и других методов идентификации. Она также поддерживает оценку CATE через интеграцию с библиотекой EconML.

Следующие шаги