СТАТИСТИЧЕСКИЕ И МАШИННЫЕ МЕТОДЫ АВТОМАТИЧЕСКОГО ИЗВЛЕЧЕНИЯ ПРИЧИННО-СЛЕДСТВЕННЫХ СВЯЗЕЙ ИЗ ТЕКСТА (ОБЗОР)

Авторы

  • Х.Б. Штанчаев Дагестанский государственный технический университет image/svg+xml

Ключевые слова:

Причинно-следственные связи, причинные знания, обработка естественного языка, машинное обучение, компьютерная лингвистика, скрытые причинные связи

Аннотация

Для решения задачи автоматического извлечения причинно-следственных связей
(ПСС) до 2000-х годов использовалась концепция нестатистических методов. Данные ме-
тоды использовали построенные вручную лингвистические шаблоны. Очевидно, что ПСС,
которые не подходили в построенные шаблоны, могли быть не определены. Нестатисти-
ческие методы требовали постоянного ручного контроля со стороны экспертов, вплоть
до оценки. Практически все методы были направлены на извлечение явных ПСС.
В некоторых методах были использованы попытки отвязать систему извлечения от кон-
кретной предметной области. Для исключения вышеупомянутых недостатков, разраба-
тываемые в дальнейшем методы начали смещаться в сторону обработки статистиче-
ских данных и машинного обучения. Был проанализирован целый ряд ценных работ, связан-
ных с новой парадигмой извлечения ПСС. Целью исследования было оценить новые методы
с возможностью выявить их преимущества и недостатки. Большим преимуществом ма-
шинных и статистических методов является независимость от предметной области с
сохранением точности извлечения. Такие методы хуже по точности, однако не привязаны
к конкретной проблемной области. Сами методы в отличие от нестатистических, кото-
рые использовали лингвистическое и синтаксическое сравнение с шаблонами вручную, со-
средоточены на поиске этих самых шаблонов. Несмотря на то, что машинные и стати-
стические методы в своем большинстве являются независимыми от предметной области
и для обучения используют большие корпуса текста они предназначены преимущественно
для английского языка. Так же отсутствует стандартизированный набор данных, кото-
рый позволил бы сравнить методы между собой. Все работы, посвященные методам, про-
игнорировали извлечение неявных ПСС.

Библиографические ссылки

Загрузки

Опубликован

2024-01-05

Выпуск

Раздел

РАЗДЕЛ I. АЛГОРИТМЫ ОБРАБОТКИ ИНФОРМАЦИИ