НЕСТАТИСТИЧЕСКИЕ МЕТОДЫ АВТОМАТИЧЕСКОГО ИЗВЛЕЧЕНИЯ ПРИЧИННО-СЛЕДСТВЕННЫХ СВЯЗЕЙ ИЗ ТЕКСТА

Авторы

  • Х. Б. Штанчаев Дагестанский государственный технический университет image/svg+xml

Ключевые слова:

Причинно-следственные связи, причинные знания, причинные отношения, обработка естественного языка, двусмысленность, компьютерная лингвистика

Аннотация

Автоматическое извлечение причинно-следственных связей (ПСС) из текстов есте-
ственного языка является сложной проблемой искусственного интеллекта. Большинство
первых попыток ее решения подразумевали использование, построенных вручную лингвис-
тических и синтаксических правил на небольших наборах данных. Однако с появлением
больших данных, доступной вычислительной мощности и с большим скачком в области
машинного обучения, концепция решения данной проблемы постепенно сдвинулась. В дан-
ной статье рассмотрена парадигма нестатистического подхода к извлечению причинно-
следственных связей, ее основа, языковые конструкции, шаблоны и классификация ПСС.
Целью стало исследование методов данной парадигмы определение их недостатков, пре-
имуществ и возможности их применения. В статье рассмотрены различные подходы, при-
веденные авторами достаточно известных и высоко цитируемых исследовательских ра-
бот и их влияние на успешность извлечения причинно-следственных связей. Анализ этих
научных работ однозначно подтвердил, что задача извлечения ПСС является крайне
сложной задачей обработки естественного языка. Наличие разнообразных лингвистиче-
ских конструкций языка, двусмысленности различного рода, а также языковые особенно-
сти очень сильно влияют на точность извлечения ПСС. Почти все нестатистические ме-
тоды столкнулись с проблемой узкоспециализированных областей знаний, где почти всегда
требуется экспертное описание. Так же практически все нестатистические методы яв-
ляются ручными или же полуавтоматическими, т. к. предполагают построение шаблонов
для определения ПСС в тексте. Несмотря на то, что нестатические методы с достаточ-
ной точностью (в среднем 70–80%) успешно справляются с рассматриваемой задачей, на
сегодняшний день отсутствует универсальный метод для извлечения ПСС. Предполагае-
мый метод должен быть универсальным относительно языков, универсальным относи-
тельно предметных областей и с возможностью определения неявных ПСС.

Библиографические ссылки

Загрузки

Опубликован

2023-06-07

Выпуск

Раздел

РАЗДЕЛ III. АЛГОРИТМЫ ОБРАБОТКИ ИНФОРМАЦИИ