Ученые петербургской «Вышки» создали базу данных по эмоциональной речи, чтобы на ее основе языковые модели ориентировались в аффективной сфере человека. Датасет включает почти три часа видеофрагментов и их расшифровок, посвященных базовым эмоциям: от радости до страха.

В ходе исследования эксперты опровергли тезис о том, что люди верно считывают эмоции друг друга по интонации звучащей речи. Вместо этого, как показали данные, более точно аффективный фон улавливается через чтение текста и при просмотре видео со звуком целиком.

База данных уже успешно используется в разных проектах. Например, на ее основе сейчас создается эмпатичный чат-бот для Государственного Эрмитажа, а ученые из Владимиро-Суздальского музея-заповедника с её помощью анализируют отзывы посетителей.