ПРИМЕНЕНИЕ БОЛЬШИХ ЯЗЫКОВЫХ МОДЕЛЕЙ ПРИ ОРГАНИЗАЦИИ ПОПОЛНЕНИЯ БАЗЫ ЗНАНИЙ О МЕТОДАХ ОБРАБОТКИ ИНФОРМАЦИИ В СИСТЕМАХ ПРИКЛАДНОЙ ФОТОГРАММЕТРИИ
Ключевые слова:
Машинное обучение, графы, обработка изображений, алгоритмы классификации, искусственный интеллект, системы поддержки принятия решений, автоматизация процессов, большие языковые модели, онтологияАннотация
Рассмотрены вопросы, связанные с автоматизацией процедуры синтеза систем прикладной
фотограмметрии. Такие системы служат для измерения и учета объектов по изображениям и в
настоящее время широко применяются в различных областях деятельности, таких как карто-
графирование, археология и аэрофотосъемка. Широкому применению также способствует по-
вышение доступности и мобильности устройств для получения изображений. Все это обусловило
проведение активных исследований, направленных на разработку методического обеспечения для
систем прикладной фотограмметрии. Отслеживание в ручном режиме появления новых методов
и алгоритмов фотограмметрической обработки информации для широкой номенклатуры облас-
тей применения достаточно затруднительно, что делает актуальной автоматизацию данной
процедуры. Предлагаемое в статье решение основано на использовании базы знаний о методах
обработки информации в системах прикладной фотограмметрии, основными элементами кото-
рой являются нечеткая онтология предметной области и база данных, что логично, т.к. инфор-
мация о предметной области может быть достаточно легко структурирована. В качестве осно-
вы для онтологии было взято существующее решение, которое было дополнено на основе резуль-
татов анализа текущего состояния предметной области. Полученная онтология далее использо-
вана для поиска и классификации методов обработки информации в системах прикладной фото-
грамметрии и заполнения базы знаний. В связи с активизацией разработки новых методов обра-
ботки информации в системах прикладной фотограмметрии возникает необходимость модифи-
кации онтологии и пополнения базы данных, т. е. пополнения базы знаний. Важным источником
информации для этого является Интернет. Для автоматизации поиска данных о методах обра-
ботки информации и пополнения базы знаний целесообразно использовать большие языковые мо-
дели, благодаря которым упрощается решение нескольких задач в области обработки естествен-
ного языка, которые включают кластеризацию и формирование новых сущностей для классифи-
кации. Соответствующий метод описан в статье. Для метода приведены результаты тестиро-
вания его работоспособности. В рамках решения задач проведён сравнительный анализ больших
языковых моделей, в результате которого была вобрана модель RoBERTa.








