Найти
Результаты поиска
-
МЕТОДЫ ОЦЕНКИ ТЕМПОРАЛЬНОЙ СТРУКТУРЫ ИНТЕРНЕТ-ДИСКУССИЙ НА ОСНОВЕ КОЛИЧЕСТВА И ПРОДОЛЖИТЕЛЬНОСТИ ВЗАИМОДЕЙСТВИЙ ПОЛЬЗОВАТЕЛЕЙ
А.Ю. Таранов155-1622025-10-01Аннотация ▼Целью исследования является разработка и проверка методов оценки темпоральной структуры интернет-дискуссий, основанных на анализе количества и продолжительности взаимодействий пользователей в интернете (в социальных сетях, на форумах и т.п.). Описываются разработанные в рамках данной работы новые методы оценки темпоральной структуры интернет-дискуссий, основанные на анализе количества и продолжительности взаимодействий пользователей в интернете. Особое внимание уделяется методам определения интенсивности и длительности дискуссий, что позволяет получить более точную оценку динамики обсуждений в реальном времени. Оценка интенсивности дискуссии производится через соотношение количества взаимодействий (таких, например, как комментарии, реплаи, лайки) и продолжительности онлайнового обсуждения. Предложен метод корректного определения длительности дискуссии, в котором производится учет не только время с момента публикации поста, но также и активность пользователей в процессе обсуждения, что делает данный метод более гибким и точным. Для проверки разработанных методов использовались реальные данные из сообществ ВКонтакте городов Таганрога и Сарова. Результаты практических исследований подтвердили существование ожидаемых закономерностей, таких, например, как суточные колебания в уровнях активности пользователей и всплески активности, связанные с различными важными общественными и политическими событиями. Разработанные методы оценки темпоральной структуры интернет-дискуссий на основе количества и продолжительности взаимодействий пользователей позволяют эффективно анализировать динамику вовлеченности участников дискуссий, выявлять ключевые моменты, а также значимые события в процессе онлайн-общения. Данные методы могут быть полезными в различных областях, таких как социальные исследования, маркетинг, политический анализ, управление репутационными рисками и другие, где требуется анализ активности и вовлеченности в интернете.
-
ИДЕНТИФИКАЦИЯ КЛЮЧЕВЫХ ТЕХНОЛОГИЙ НА ОСНОВЕ СБОРА И АНАЛИЗА ДАННЫХ ИЗ ОТКРЫТЫХ РУССКОЯЗЫЧНЫХ ИСТОЧНИКОВ
А.Г. Бондаренко , А.Г. Кравец144-1592025-07-24Аннотация ▼Данная статья посвящена разработке и апробации нового подхода к сбору, обработке и анализу открытых данных на русском языке для идентификации ключевых технологических направлений. Для решения задачи формирования и последующего анализа структурированных датасетов разработаны и программно реализованы методы веб-скрейпинга, обработки естественного языка и анализа временных рядов. Описанный в статье подход впервые применен для извлечения и структурирования информации из научных статей, новостных ресурсов и патентной документации на русском языке. В результате анализа полученного датасета научных публикаций выделены 30 наиболее часто упоминаемых биграмм и столько же триграмм технологических терминов.
На основе анализа частотности биграмм и триграмм выделены ключевые технологические термины, которые затем использованы для комплексной фильтрации по ключевым технологиям. Комплексная фильтрация позволила осуществить поиск русскоязычных патентов и их сбор для дальнейшего анализа. В результате предварительной обработки полученной патентной информации сформированы временные ряды патентной активности. Программная система идентификации ключевых технологий реализована на JavaScript и Python с использованием библиотек Selenium и BeautifulSoup для веб-скрейпинга, NLTK и Scikit-learn для обработки и анализа текстовых данных. Исследование динамики развития ключевых технологий во времени позволило выявить периоды интенсивной патентной деятельности и снижения интереса к той или иной технологии. Результаты, изложенные в статье, создают основу для дальнейшей разработки методов машинного обучения с целью прогнозирования технологического развития и выявления перспективных направлений прикладных исследований. -
ИДЕНТИФИКАЦИЯ НЕЯВНЫХ УГРОЗ НА ОСНОВЕ АНАЛИЗА АКТИВНОСТИ ПОЛЬЗОВАТЕЛЯ В ИНТЕРНЕТ-ПРОСТРАНСТВЕ
В. В. Бова , Д.Ю. Запорожец , Ю.А. Кравченко , Э. В. Кулиев , В.В. Курейчик , Н. А. Лызь2020-10-11Аннотация ▼Статья посвящена проблеме идентификации неявных информационных угроз п о-
исковой деятельности пользователя в Интернет-пространстве на основе анализа его
активности в процессе данного взаимодействия. Применение знаний, хранящихся в
интернет-пространстве, для реализации преступных намерений несет в себе угрозу
для всего общества. Выявление злого умысла в действиях пользователей глобаль ной
информационной сети не всегда является тривиальной задачей. Отработанные техн о-
логии анализа контекста интересов пользователя дают сбой в случае осторожных
грамотных действий злоумышленников, которые в явном виде не демонстрируют пр е-
следуемой ими цели. В работе проведен анализ угроз, связанных с определенными сц е-
нариями реализации поисковых процедур, проявляющихся в поисковой деятельности.
Описаны критерии оценки неэффективных и эффективного сценариев поиска. Среди
признаков, указывающих на возможность наличия угрозы, выделены следующие основ-
ные: уход от решения задачи в бесцельную навигацию или к привлекательным ресурсам,
поверхностный поиск, отсутствие смыслового погружения в решение поисковой зад а-
чи, хаотичные действия при поиске. Для определения налич ия неблагоприятных при-
знаков построена система показателей. Сформулированы признаки эффективного
сценария организации поиска в Интернет-пространстве, описаны варианты наличия
неявных угроз для подобной ситуации. Представлен подход идентификации описанных
угроз с учетом заданных критериев оценки различных сценариев поведения пользоват е-
ля в глобальном информационном пространстве. Разработан алгоритм машинного
обучения для идентификации проблемных сценариев путем сравнения с ключевыми
паттернами поведения. Создана программная реализация подсистемы идентификации
информационных угроз, проведены экспериментальные исследования для подтвержд ения эффективности подсистемы. Экспериментальные исследования проводились на основе обработки открытых данных из социальных сетей, а также с применением
анализа поисковой деятельности пользователей в университетской корпоративной
информационной среде.








