МЕТОДЫ ИЗВЛЕЧЕНИЯ ПРИЧИННОСТИ ИЗ ДАННЫХ НАБЛЮДЕНИЙ В ПРАКТИКЕ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА

  • М.Ю. Георги Южный федеральный университет
Ключевые слова: Причинно-следственный ИИ, Объективность ИИ, скоростное обучение, прогноз под вмешательством

Аннотация

Обсуждается значимость извлечения причинно-следственных связей в машинном
обучении для принятия решений и оценки воздействия на реальный мир. Отмечается, что
большинство текущих успехов в машинном обучении основаны на огрубленном распознава-
нии образов и корреляционном анализе, но для более сложных задач необходимо извлекать
причинно-следственные связи. Декларируется что проблемы объяснимости прогнозов и
причинно-следственного понимания, даже с применением передовых методик машинного
обучения LIME, SHAP, TreeSHAP, DeepSHAP, Shapley Flow, являются фундаментальными
препятствиями в развитии искусственного интеллекта. В статье кратко раскрываются
основные философские математические концепции и определения причинности, включая
понятия контрфактуалов, байесовских сетей, направленных ациклических графов и при-
чинно-следственного формального вывода. Делается вывод о том, что практическая зна-
чимость базирующегося на данных причинно-следственного анализа, состоит в ответах
на априори сформулированные вопросы, которые могут отражать гипотетическую связь
между событием (причиной) и вторым событием (следствием), где второе событие явля-
ется прямым следствием первого. Далее производится сравнительный анализ способов и
основных сценариев использования фреймворков ausal Discovery и ausal Inference, на базе
которых возникает возможность сделать предположения о расположенной в основе ис-
следуемого набора данных причинно-следственной структуре и задействовать статисти-
ческие методы для оценки силы и направления таких связей. В статье также обсуждают-
ся методы и алгоритмы причинно-следственного анализа и их применение в реальных зада-
чах. Упоминаются репрезентативные методы, такие как модели на основе ограничений,
модели на основе оценок и функциональные каузальные модели, тесты (условные) на неза-
висимость, оценочные функции, всё то что может быть задействовано для решения про-
блемы извлечения причинно-следственных связей из обсервационных данных, большинство
которых реализовано в open-source фреймворки, таких как Microsoft DoWhy, Uber
CausalML, causal-learn, Econ-ml и многие другие, которые реализуют большинство упомя-
нутых методов причинно-следственного анализа.

Литература

1. Hassani H., Xu H., Mansi G. Big data and causality, Annals of Data Science, 2018, 5, pp. 133-156.
2. Pearl J., Mackenzie D. The book of why. Penguin Books, 2019.
3. Schölkopf B., Locatello F., Bauer S., Ke N.R., Kalchbrenner N., Goyal A., and Bengio Y. Toward
causal representation learning, Proceedings of the IEEE, 2021, 109 (5), pp. 612-634.
4. Naser M. Causality, causal discovery, and causal inference in structural engineering, arXiv
preprint arXiv:2204.01543, 2022.
5. Hernán M., Robins J. Estimating causal effects from epidemiological data, Journal of Epidemiology
and Community Health, 2006 Jul., 60 (7), pp. 578-586.
6. Lesher J.H.H. Hume's Analysis of "Cause" and the 'Two-Definitions' Dispute, Journal of the
History of Philosophy, 1973, 11 (3), pp. 387-392.
7. Lewis D. Causation, The journal of philosophy, 1973, 70 (17), pp. 556-567.
8. Hofer-Szabó G., Rédei M., Szabó L.E. On Reichenbach's common cause principle and
Reichenbach's notion of common cause, The British Journal for the Philosophy of Science,
1999, 50 (3), pp. 377-399.
9. Pearl J. An Introduction to Causal Inference, The International Journal of Biostatistics, 2010, 6 (2).
10. Glymour M., Pearl J., Jewell N.P. Causal inference in statistics: A primer. John Wiley & Sons.
2016.
11. Bareinboim E., Pearl J. Causal inference and the data-fusion problem, Proceedings of the
National Academy of Sciences, 2016, 113 (27), pp. 7345-7352.
12. Pellet J.P. Effective Causal Analysis: Methods for Structure Learning and Explanations, 2010.
(Doctoral dissertation, ETH Zurich).
13. Triantafillou S., Tsamardinos I. Constraint-based causal discovery from multiple interventions
over overlapping variable sets, The Journal of Machine Learning Research, 2015, 16 (1),
pp. 2147-2205.
14. Glymour C., Zhang K., Spirtes P. Review of causal discovery methods based on graphical
models, Frontiers in genetics, 2019, 10, pp. 524.
15. Nogueira A.R, Pugnana A., Ruggieri S., Pedreschi D., Gama J. Methods and tools for causal
discovery and causal inference, Wiley interdisciplinary reviews: data mining and knowledge
discovery, 2022, 12 (2), e1449.
16. Yao L., Chu Z., Li S., Li Y., Gao J., Zhang A. A survey on causal inference, ACM Transactions
on Knowledge Discovery from Data (TKDD), 2021, 15 (5), pp. 1-46.
17. Rubin D.B. Estimating causal effects of treatments in randomized and nonrandomized studies,
Journal of educational Psychology, 1974, 66 (5), pp. 688.
18. Imbens G.W., Rubin D.B. Causal inference in statistics, social, and biomedical sciences. Cambridge
University Press, 2015.
19. hernozhukov V., Wüthrich K., Zhu Y. An exact and robust conformal inference method for
counterfactual and synthetic controls, Journal of the American Statistical Association, 2021,
116 (536), pp. 1849-1864.
20. Pearl J. Causal diagrams for empirical research, Biometrika, 1995, 82 (4), pp. 669-688.
21. Pearl Judea. The do-calculus revisited, arXiv preprint arXiv:1210.4852, 2012.
22. Vonk M., Malekovic N., Bäck T., Kononova A. Disentangling causality: assumptions in causal
discovery and inference, Artificial Intelligence Review, 2023, pp. 1-37.
23. Teinemaa I., Albert J., Goldenberg D. Uplift modeling: from causal inference to personalization,
In Companion Proceedings of the Web Conference, 2021.
Опубликован
2023-08-14
Выпуск
Раздел
РАЗДЕЛ II. АЛГОРИТМЫ ОБРАБОТКИ ИНФОРМАЦИИ