АНАЛИЗ ТОНАЛЬНОСТИ ТЕКСТОВЫХ ОТЗЫВОВ С ПРИМЕНЕНИЕМ ТОНАЛЬНЫХ СЛОВАРЕЙ И КАРДИНАЛЬНОСТИ НЕЧЕТКОГО МНОЖЕСТВА
Ключевые слова:
Анализ тональности, обработка естественного языка, нечеткая логика, оценка тональности, SentiWordNet, AFINNАннотация
Анализ тональности или мнений направлен на определение полярности мнения людей
в отношении к какому-либо продукту, услуге, мероприятию или любому человеку. Один из
самых распространенных методов, применяемый при анализе тональности текстового
контента – обработка естественного языка. Тональность текста на естественном язы-
ке может быть оценена с помощью многочисленных методологий, таких как алгоритмы
машинного обучения и статистические инструменты, в то время как применение нечет-
кой логики не является распространенным явлением. Использование нечеткой логики было
выбрано по следующим причинам. Во-первых, нечеткая логика хорошо справляется с лин-
гвистической неопределенностью. Такой способ определения проблемы приводит к умень-
шению предвзятости как с положительной, так и с отрицательной стороны. Во-вторых,
подходы к обучению на основе нечетких правил коренным образом отличаются от тех
подходов к обучению, которые широко используются при классификации настроений, та-
ких как метод опорных векторов, метод наивного Байеса и т. д., так как относятся к ге-
неративному обучению, т. е. целью обучения является оценка степени принадлежности
экземпляра к каждому отдельному классу. Предлагаемая модель для анализа тональности
текстовых обзоров основана на использовании тональных словарей с применением нечет-
кой логики и состоит из четырех основных этапов. Этапы включают в себя токенизацию,
формулировку модели мешка слов, формулировку нечеткой оценки тональности и присвое-
ние полярности. В предложенной модели используется мощность нечеткого множества
как мера оценки показателей полярности слов. Значения полярности слов получены путем
применения двух тональных словарей: SentiWordNet и AFINN. Созданы две версии модели в
зависимости от типа используемого словаря: на основе SentiWordNet и AFINN. Сравнение
представленного подхода на основе нечеткой логики с другими методами на основе слова-
рей демонстрирует превосходство разработанных моделей, основанных на применении
нечеткой логики.








