Выпуски
2022 90 91        
2021 84 85 86 87 88 89
2020 78 79 80 81 82 83
2019 72 73 74 75 76 77
2018 66 67 68 69 70 71
2017 60 61 62 63 64 65
2016 54 55 56 57 58 59
2015 48 49 50 51 52 53
2014 42 43 44 45 46 47
2013 36 37 38 39 40 41
Новости
Отправить статью
Подписаться на рассылку








Выпуск № 91. Апрель 2022 г.

Семантический анализ структуры ценностей группы с помощью Тезауруса Роже: автоматизированный алгоритм

Андреюк Денис Сергеевич, Ливитина Арина Сергеевна, Сушко Никита Сергеевич

Андреюк Денис Сергеевич
Кандидат биологических наук, доцент, экономический факультет, МГУ имени М.В. Ломоносова; старший научный сотрудник, Государственное бюджетное учреждение здравоохранения города Москвы «Психиатрическая клиническая больница № 1 им. Н.А. Алексеева Департамента здравоохранения г. Москвы»; исполнительный директор Общероссийской общественной организации «Российская ассоциация содействия науке», Москва, РФ.
E-mail: denis.s.andreyuk@yandex.ru
SPIN-код РИНЦ: 8083-4058
ORCID ID: 0000-0002-3349-5391

Ливитина Арина Сергеевна
Аналитик, ООО «РА «ИНДЕКС 20», Москва, РФ.
E-mail: arina.livitina@gmail.com
ORCID ID: 0000-0002-1060-7688

Сушко Никита Сергеевич
Программист-разработчик ПО, АО «Медицинские Технологии Лтд», Москва, РФ.
E-mail: gorakievskaya@gmail.com
ORCID ID: 0000-0003-2245-7354

В работе предложен подход для векторизации и количественного анализа ценностей группы. Для демонстрации возможностей метода проведен анализ структуры ценностей группы молодых людей на предмет различий между женщинами и мужчинами и различий при использовании разных частей речи. Ценности группы были вербализованы в виде свободных ассоциаций «с чем-то самым важным в жизни». Полученный массив слов преобразовали в массив семантических групп с помощью Тезауруса Роже. Попарное сравнение векторов с частотами отдельных семантических групп показало высокий уровень косинусной близости (0,9664) между подгруппами, разделенными по гендерному признаку. Расчет статистически значимых различий в частотах отдельных семантических групп методом Хи-квадрат позволил выделить отдельные семантические группы, по которым гендерные подгруппы достоверно различаются. Векторы частот, полученные от преобразования массивов разных частей речи, имели низкий уровень косинусной близости во всех попарных сравнениях. Существительные наиболее часто использовали для выражения жизненных ценностей, имеющих отношение к причинно-следственным связям (14% семантических групп); прилагательными чаще всего выражали ценности, имеющие смысл личных пристрастий (18% сематических групп); глаголы чаще всего использовали для выражения ценностей, связанных с симпатиями (14% семантических групп). Разработанный автоматический алгоритм может быть полезен для количественного сопоставления ценностей между разными группами, а также расчета степени соответствия ценностей целевой группы заявляемым ценностям коммерческих брендов.

Ключевые слова

Семантический анализ, тезаурус Роже, программа на языке Python, векторизация ценностей, ценности молодежи.

DOI: 10.24412/2070-1381-2022-91-148-161

Комментарии:
Любое использование материалов допускается только при наличии гиперссылки на e-journal.spa.msu.ru.
119991, Москва, Ломоносовский проспект, д. 27, корпус 4, А-701; тел.: (495) 930-85-71
Copyright © 2003–2015 ФГУ МГУ
Яндекс.Метрика