Ко Дню святого Валентина Яндекс Музыка узнала из чего сделаны русскоязычные песни о любви и вдохновила Балабобу писать романтические куплеты.
Самым романтическим жанром ожидаемо стала поп-музыка — более 72% песен посвящены любви. Среди самых «любвеобильных» поп-исполнителей оказались Artik&Asti, Юрий Шатунов и NЮ. На втором месте оказался шансон, а реже всего о светлом чувстве поют рэперы и рокеры — 27% и 28%. Для каждого жанра также отобрали самые характерные слова: у лидирующей поп-музыки это винишко, наболеть и по-английски, у рэперов — дилер и поделом, а исполнители шансона поют о девчоночке и черемухе.
Неудивительно, что самым частотным словом стало любовь — оно встречается практически в каждом втором из отобранных текстов. Следом идут слова знать, хотеть, глаза, один, любить, сердце и ночь. Причем, в любовной лирике они встречаются чаще, чем в других текстах.
Из растений и животных в лиричных треках характерно упоминание ромашек, роз и мотыльков, чего не скажешь о крысах, мышах и медведях —оникажутся романтичным очень малому количеству артистов. Такая же судьба у хлеба, пива и яблок. В романтичности они уступили шоколаду, кофе и вишне.
Треки также были разделены по настроению — на радостные и грустные. Оказалось, любовная лирика чаще печальная: позитивных треков чуть больше 10% — в пять раз меньше, чем меланхоличных. Самыми оптимистичными жанрами оказались поп и рэп, а самыми пессимистичными — инди и рок.
Судя по частотным глаголам, в грустных песнях обычно прощают и отпускают, убивают и умирают, молчат и кричат. А в радостных танцуют, нравятся, улыбаются, манят, крадут (любовь, сердца, сны), сияют и целуются.
Ко дню всех влюбленных подготовился и Балабоба — он изучил несколько тысяч треков о любви на Яндекс Музыке и теперь умеет сочинять куплеты. Достаточно ввести первую строчку, и Балабоба сам закончит четверостишие.
«Остальное ерунда — так сердечко говорит
Так что я спокоен, не волнуйся, просто будь
И не говори, что ты — не я, а я — не ты
Мы с тобой, как два звена одной золотой цепи»
Базу русскоязычной любовной лирики для исследования создали пользователи Толоки — из более 20 тысяч изученных треков они выделили чуть больше 8,5 тысячи песен о любви, что составляет порядка 40%. Затем аналитики проанализировали тексты и нашли самые характерные и нехарактерные слова: действия, предметы одежды, продукты, даже животных и растения, которые встречаются в треках.
Изучать тексты любимых песен, подпевая в такт, может любой пользователь Яндекс Музыки — для этого достаточно воспользоваться функцией «Текстомузыка» в приложении и просматривать тексты композиций. Также недавно Яндекс Музыка обновила поиск, и теперь треки можно искать даже по словам из песен.
Справка:
Яндекс Музыка — стриминговая платформа, которая дает доступ к каталогу из 80 млн музыкальных треков и порядка 440 тысяч эпизодов подкастов. В основе сервиса лежит система рекомендаций Моя волна, которая подстраивается под вкусы каждого пользователя.
Балабоба — разработанная командой Яндекса языковая модель YaLM (Yet another Language Model), вдохновленная GPT-3 от компании OpenAI и другими языковыми моделями на архитектуре Transformer. У такой модели ровно одна задача — генерировать каждое последующее слово в предложении. Чтобы текст получился связным и грамматически правильным, во время обучения модель оценивает каждое предсказанное слово: например, решает может ли после «Мама мыла…» идти слово «бегать» или слово «раму».
Толока — технологическая платформа для сбора и разметки данных. Благодаря ей развивается Поиск Яндекса, Алиса, беспилотные технологии, Карты, Такси и многие другие продукты. Это открытая платформа: её использует не только Яндекс, она уже помогает решать бизнес-задачи компаниям из разных сфер.