Цифровое пространство уже давно стало не только одной из центральных площадок для общения, но и инструментом изучения мнений аудитории. Анализ распространения информации и ее восприятия является актуальной научной задачей, а междисциплинарные подходы открывают новые возможности для исследования социальных конфликтов, что особенно актуально в мегаполисах. Ученые МФТИ, НИУ ВШЭ, РГСУ и Московского центра урбанистики «Город» разработали аналитический метод с помощью технологий искусственных нейронных сетей и на примере реальной конфликтной ситуации представили анализ контента вовлеченных пользователей. Результаты работы опубликованы в журнале ISAIC.
В качестве инструмента на основе нейросетевых технологий использовался программный продукт TextAnalyst 2.3. Предмет исследования — строительство Юго-Восточной хорды в Москве. Интересы городских властей, крупного бизнеса и горожан часто не совпадают, и наглядным тому примером являются проекты развития или реконструкции объектов городской инфраструктуры. В этом случае одной из важных задач городских властей становится урегулирование возникающих разногласий, а также исправление ситуаций, угрожающих общественному порядку. Эти вопросы удается разрешить благодаря возможности анализа текстов участников конфликта с помощью программы TextAnalyst, которая автоматически извлекает основное содержание текстов, в том числе содержание, окрашенное эмоционально. Программа представлена в двух ипостасях: как персональный продукт и как SDK (Soft Development Kit) для встраивания функциональности в программы заказчика.
Программная технология TextAnalyst, реализованная с использованием искусственных нейронных сетей, позволяет анализировать тексты естественного языка, извлекая из них семантические сети — графовые представления содержания текстов, включающие в качестве вершин основные концепты текста, снабженные их весовыми характеристиками (их значимостью в тексте). Представленная таким образом информация позволяет сравнивать тексты по смыслу, классифицировать их и извлекать наиболее значимую информацию.
«Междисциплинарный подход к интерпретации больших объемов данных социальных медиа позволяет в режиме реального времени решать различные задачи, например проследить возникновение социальной напряженности и провести предиктивную аналитику конфликтных ситуаций», — рассказала о проекте Мария Пильгун, профессор, ведущий научный сотрудник Междисциплинарной научно-исследовательской лаборатории ФГБОУ ВО «Российский государственный социальный университет».
Анализ информационного поля вокруг строительства хорды показал, что рост негативного восприятия активнее формируется и распространяется через личные аккаунты, что позволяет привлечь широкую целевую аудиторию и достичь высокой степени вовлеченности. Вначале контент имел скорее нейтральный информационный характер, но ближе к реализации проекта негатив возрастал и стал доминантным. На всех этапах развития конфликта основное внимание аудитории было сосредоточено на контенте социальных сетей, которые активно поддерживали заинтересованность пользователей.
«“Управлять — значит исправлять”, как сказал Конфуций. Наша исследовательская группа считает, что большинство конфликтов легче разрешить в самом начале, не дожидаясь обострения. Для этого органы городского управления должны их своевременно идентифицировать и верно оценивать угрозу нежелательного развития ситуации. Наш подход открывает новые возможности прогнозирования рисков подобных ситуаций, что мы наглядно показали на примере социальной активности вокруг строительства Юго-Восточной хорды в Москве», — отметил Александр Харламов, руководитель кафедры интеллектуальных информационных систем и технологий МФТИ, профессор НИУ ВШЭ.
Пользовательский контент, связанный со строительством, характеризуется изменением соотношения присутствия аудитории в интернет-пространстве в зависимости от временных этапов.
Стадии | Дата | Аудитория |
1 стадия | Апрель — июнь 2019 года | 352 267 |
2 стадия | Июнь — сентябрь 2019 года | 17 583 997 |
3 стадия | Октябрь — декабрь 2019 года | 65 588 26 |
4 стадия | Январь — февраль 2020 года | 99 096 49 |
5 стадия | Март 2020 года | 130 180 782 |
Таблица 1. Сбор данных проводился с использованием системы мониторинга Brand Analytics. Единица измерения аудитории — акторы
Первый этап: контент размещался в основном в социальных сетях (97%), небольшая часть — в блогах (2,7%) и менее 1% — в микроблогах.
Второй этап: большая часть контента оставалась в социальных сетях (71,5%), но информационная активность в микроблогах (16%) и видео (12%) увеличилась, а доля блогов сократилась до 0,5%.
Третий этап: наблюдался рост объема контента в видеороликах до 13,8% и в социальных сетях до 75,6%, а в микроблогах, напротив, интерес снизился до 10%, доля блогов составила 0,6%.
Четвертый этап: активность в микроблогах выросла до 19,4%, а в блогах — до максимального значения: 2,6%. Активность в социальных сетях снизилась до 70%, но они остались лидерами, видеоролики сократили свою долю до 8%.
Пятый этап: доля социальных сетей вновь возросла до 79,2%, доля микроблогов — 12,9%, видео — 7,5%. Наблюдалось снижение активности в блогах (1%).
Эмоционально-смысловые характеристики также изменились с течением времени:
Первый этап — отсутствие агрессии, нейтральный контент, состоящий в основном из официальных сообщений.
Второй этап — рост активности пользователей. Основной контент — комментарии в социальных сетях и посты, что показало достаточно высокий уровень интереса жителей Москвы к данному проекту. Именно на этом этапе появился негативный настрой, наиболее активный в соцсетях и микроблогах, а постоянный рост сообщений продемонстрировал повышение протестных настроений.
Третий этап — наметилось резкое увеличение негативного восприятия строительства ТРЦ, наиболее сильная агрессия отмечалась в соцсетях, на видеоресурсах и в микроблогах. Негативные посты значительно опережали нейтральные и позитивные.
Четвертый этап — преобладающая негативная реакция аудитории.
Пятый этап – сохранение резкого негативного восприятия ситуации. Пик роста активности пришелся на 18–25 марта, что было вызвано началом строительных работ и протестом активистов. Наблюдалась сильная агрессия в социальных сетях. Показательно, что сильная агрессия в сети значительно превышала показатели наличия реальных конфликтов. Спад активности был связан с началом пандемии COVID-19 в Москве, что в значительной мере отвлекло пользователей от строительных проблем.
«Представленный подход продемонстрировал возможность оценки рисков эскалации конфликта за счет мониторинга роста социального стресса в текстах пользователей. Использование нейронных сетей позволяет быстро обрабатывать большое количество сообщений, а также одновременно расследовать несколько конфликтных ситуаций. Представленная технология может быть использована как один из методов прогнозной аналитики в системах поддержки принятия решений. В то же время стоит отметить, что ее эффективность зависит от объема задач. Все виды конфликтов (градостроительные, политические, социальные) требуют отдельной конфигурации и обучения нейронной сети. Преимущество их использования — это растущая способность к обучению, когда качество анализа повышается по мере решения задач, а основное достоинство — возможность автоматизировать процесс классификации тональности текста», — заключил Александр Харламов.
Кафедра интеллектуальных информационных систем и технологий открыта в ФРКТ МФТИ. Студенты могут начать заниматься прикладными исследованиями в области информационно-телекоммуникационных технологий, систем и техники в бакалавриате или после поступления в магистратуру или аспирантуру ФРКТ МФТИ.