НЕСТАТИСТИЧЕСКИЕ МЕТОДЫ АВТОМАТИЧЕСКОГО ИЗВЛЕЧЕНИЯ ПРИЧИННО-СЛЕДСТВЕННЫХ СВЯЗЕЙ ИЗ ТЕКСТА

  • Х. Б. Штанчаев Дагестанский государственный технический университет
Ключевые слова: Причинно-следственные связи, причинные знания, причинные отношения, обработка естественного языка, двусмысленность, компьютерная лингвистика

Аннотация

Автоматическое извлечение причинно-следственных связей (ПСС) из текстов есте-
ственного языка является сложной проблемой искусственного интеллекта. Большинство
первых попыток ее решения подразумевали использование, построенных вручную лингвис-
тических и синтаксических правил на небольших наборах данных. Однако с появлением
больших данных, доступной вычислительной мощности и с большим скачком в области
машинного обучения, концепция решения данной проблемы постепенно сдвинулась. В дан-
ной статье рассмотрена парадигма нестатистического подхода к извлечению причинно-
следственных связей, ее основа, языковые конструкции, шаблоны и классификация ПСС.
Целью стало исследование методов данной парадигмы определение их недостатков, пре-
имуществ и возможности их применения. В статье рассмотрены различные подходы, при-
веденные авторами достаточно известных и высоко цитируемых исследовательских ра-
бот и их влияние на успешность извлечения причинно-следственных связей. Анализ этих
научных работ однозначно подтвердил, что задача извлечения ПСС является крайне
сложной задачей обработки естественного языка. Наличие разнообразных лингвистиче-
ских конструкций языка, двусмысленности различного рода, а также языковые особенно-
сти очень сильно влияют на точность извлечения ПСС. Почти все нестатистические ме-
тоды столкнулись с проблемой узкоспециализированных областей знаний, где почти всегда
требуется экспертное описание. Так же практически все нестатистические методы яв-
ляются ручными или же полуавтоматическими, т. к. предполагают построение шаблонов
для определения ПСС в тексте. Несмотря на то, что нестатические методы с достаточ-
ной точностью (в среднем 70–80%) успешно справляются с рассматриваемой задачей, на
сегодняшний день отсутствует универсальный метод для извлечения ПСС. Предполагае-
мый метод должен быть универсальным относительно языков, универсальным относи-
тельно предметных областей и с возможностью определения неявных ПСС.

Литература

1. Khoo C.S., Kornfilt J., Oddy R.N., Myaeng S.H. Automatic extraction of cause-effect information
from newspaper text without knowledge-based inferencing, Literary and Linguistic
Computing, 1998. Vol. 13, No. 4, pp. 177-186.
2. Altenberg B. Causal linking in spoken and written English, Studia linguistic, 1984. Vol. 38,
No. 1, pp. 20-69.
3. Selfridge M. Toward a natural language-based causal model acquisition system // Applied
Artificial Intelligence an International Journal. 1989. Vol. 3, №2-3. P. 191–212.
4. Kaplan R. M., Berry-Rogghe G. Knowledge-based acquisition of causal relationships in text //
Knowledge Acquisition, 1991, Vol. 3, No. 3, pp. 317-337.
5. Doyle R.J. Hypothesizing and refining causal models, DTIC Document, Tech. Rep., 1984.
6. Grishman R. Domain modeling for language analysis, Linguistic approaches to artificial intelligence,
1990, pp. 41-58.
7. Kontos J., Sidiropoulou M. On the acquisition of causal knowledge from scientific texts with
attribute grammars, International Journal of Applied Expert Systems, 1991, Vol. 4, No. 1,
pp. 31-48.
8. Garcia D. Coatis, an NLP system to locate expressions of actions connected by causality links,
in Knowledge Acquisition, Modeling and Management, Springer, 1997, pp. 347-352.
9. Khoo C.S., Chan S., Niu Y. Extracting causal knowledge from a medical database using graphical
patterns, Proceedings of the 38th Annual Meeting on Association for Computational Linguistics.
Association for Computational Linguistics, 2000, pp. 336-343.
10. Khoo C.S., Chan S., Niu Y., Ang A. A method for extracting causal knowledge from textual
databases, Singapore journal of library & information management, 1999, Vol. 28, pp. 48-63.
11. Khoo C.S. Automatic identification of causal relations in text and their use for improving precision
in information retrieval // Ph.D. dissertation. 1995.
12. Finn R. Program uncovers hidden connections in the literature, The Scientist, 1998, Vol. 12,
No. 10, pp. 12-13.
13. Girju R. and Moldovan D. Text mining for causal relations, FLAIRS Conference, 2002,
pp. 360-364.
14. Chan K. and Lam W. Extracting causation knowledge from natural language texts, International
Journal of Intelligent Systems, 2005, Vol. 20, No. 3, pp. 327-358.
15. Low B.-T., Chan K., Choi L.-L., Chin M.-Y., Lay S.-L. Semantic expectation-based causation
knowledge extraction: A study on Hongkong stock movement analysis, Advances in
Knowledge Discovery and Data Mining. Springer, 2001, pp. 114-123.
16. Chan K., Low B.-T., Lam W., Lam K.-P. Extracting causation knowledge from natural language
texts. Springer, 2002.
17. Ittoo A., Bouma G. Extracting explicit and implicit causal relations from sparse, domain-specific
texts, Natural Language Processing and Information Systems. Springer, 2011, pp. 52-63.
18. Ittoo A., Bouma G. Minimally supervised learning of domain specific causal relations using an
open-domain corpus as knowledge base, Data & Knowledge Engineering, 2013, Vol. 88,
pp. 142-163.
19. Bethard S., Corvey W.J., Klingenstein S., Martin J.H. Building a corpus of temporal-causal
structure, LREC, 2008.
20. Al Hashimy H., Saleh A., Kulathuramaiyer N. Ontology enrichment with causation relations,
Systems, Process & Control (ICSPC) 2013 IEEE Conference on. IEEE, 2013, pp. 186-192.
21. Sadek J. Automatic detection of arabic causal relations, Natural Language Processing and
Information Systems. Springer, 2013, pp. 400-403.
22. Ackerman E.J.M. Extracting a causal network of news topics, On the Move to Meaningful
Internet Systems: OTM 2012 Workshops. Springer, 2012, pp. 33-42.
23. Ishii H., Ma Q., Yoshikawa M. Causal network construction to support understanding of news, in
System Sciences (HICSS), 2010 43rd Hawaii International Conference on. IEEE, 2010, pp 1-10.
24. Incremental construction of causal network from news articles Information and Media Technologies,
2012, Vol. 7, No. 1, pp. 110-118.
25. Arauz P.L. and Faber P. Causality in the specialized domain of the environment, Semantic Relations-
II. Enhancing Resources and Applications Workshop Programme, Citeseer, 2012, pp. 10.
Опубликован
2023-06-07
Выпуск
Раздел
РАЗДЕЛ III. АЛГОРИТМЫ ОБРАБОТКИ ИНФОРМАЦИИ