ОПРЕДЕЛЕНИЕ ТОНАЛЬНОСТИ ТЕКСТА С УЧЕТОМ ВЛИЯНИЯ МОДИФИКАТОРОВ ИНТЕНСИВНОСТИ И ПРИМЕНЕНИЕМ НЕЧЕТКИХ ПРАВИЛ
Ключевые слова:
Анализ тональности, нечеткие правила, модификаторы интенсивности, словарь тональностиАннотация
Выражение чувств – неотъемлемая часть человеческой жизни и коммуникации. Чтобы соз-
дать компьютеры, способные лучше служить человечеству, в области информатики продолжа-
ются исследования по разработке алгоритмов машинного обучения, которые могут обрабаты-
вать текстовые данные и выполнять задачи анализа тональности текстов на естественном
языке. Доступность онлайн-обзоров и повышенные ожидания конечных пользователей также
стимулируют разработку систем интеллектуального анализа мнений, которые могут автомати-
чески классифицировать и обобщать отзывы пользователей. С каждым годом исследований в
области распознавания эмоций в тексте все больше, но только малая их часть посвящена приме-
нению нечеткой логики. В основном, это происходит потому, что исследователи ограничиваются
бинарной классификацией отношений – «положительное» и «отрицательное», реже добавляя еще
третий класс – «нейтральное». Применение же нечеткой логики помогает определить оттенки
эмоций, не просто «хорошо» и «плохо», а насколько хорошо или насколько плохо. Количество оп-
ределяемых классов определяет глубину детализации. Ранее нами была предложена нечеткая мо-
дель определения тональности на основе словарей, в данном исследовании мы предлагаем улуч-
шенную модель определения тональности текста на основе тонального словаря (SentiWordNet) и
нечетких правил. Для повышения точности и достоверности анализа тональности были примене-
ны коэффициенты, учитывающие эмоциональную нагрузку слов разных частей речи и действие
модификаторов интенсивности, способствующих усилению либо ослаблению эмоциональных от-
тенков. Количественное значение тональности текста получено в результате агрегирования
нормированных данных по эмоциональным классам с применением методов нечеткого вывода.
В результате исследования было выявлено, что учет влияния модификаторов интенсивности зна-
чительно повышает точность предложенного ранее авторами метода, а также способствует
определению границ при проведении детализированной оценки отношений по 7 классам («очень
положительное», «положительное», «скорее положительное», «нейтральное», «скорее отрица-
тельное», «отрицательное», «очень отрицательное»).








