Notebookcheck Logo

Яндекс выпускает набор данных музыкальных рекомендаций с открытым исходным кодом Yambda

Бесплатный набор данных Yahdex Yambda позволяет любому человеку создать свой собственный сервис музыкальных рекомендаций. (Источник изображения: Яндекс)
Бесплатный набор данных Yahdex Yambda позволяет любому человеку создать свой собственный сервис музыкальных рекомендаций. (Источник изображени
Яндекс выпустил Yambda, крупнейший в мире открытый набор данных для музыкальных рекомендательных систем, содержащий 4,79 миллиарда анонимизированных пользовательских взаимодействий, чтобы помочь разработчикам создать умные музыкальные сервисы, воспроизводящие только те песни, которые слушатели хотят услышать.

Яндекс выпустил набор данных Yambda с открытым исходным кодом, содержащий информацию о предпочтениях слушателей музыки, для использования при создании сервиса потокового аудио, подобного Spotify, с персонализацией плейлистов на основе искусственного интеллекта.

Потоковые сервисы, такие как Spotify, Tidal и Qobuz, используют программные алгоритмы или модели искусственного интеллекта для создания плейлистов на основе индивидуальных предпочтений. Эти сервисы обычно не публикуют свой код или модели, поскольку их уникальная способность автоматически воспроизводить песни, которые нравятся слушателям, считается коммерческой тайной, обеспечивающей их успех.

Яндекс собрал данные за десять месяцев в виде 4,79 миллиарда взаимодействий пользователей с 9,39 миллионами музыкальных треков из 28 миллионов ежемесячных пользователей Яндекс Музыки пользователей. Это включает в себя ключевые отзывы слушателей Яндекс Музыки - то, что они предпочитают слушать, а также их симпатии и антипатии. Все взаимодействия отмечаются временными метками для повышения точности.

Набор данных можно загрузить в виде моделей событий размером пять миллиардов (1 миллион пользователей), пятьсот миллионов (100 000 пользователей) и пятьдесят миллионов (10 000 пользователей), причем максимальный размер требует не менее 85 ГБ дискового пространства. Набор данных хранится в формате Apache Parquet формате, ориентированном на столбцы данных для удобства анализа и исследований.

Читатели могут подарить потоковую музыку с помощью подарочной карты Spotify.

Этот важный материал точно понравится твоим друзьям в социальных сетях!
Mail Logo
'
> Обзоры Ноутбуков, Смартфонов, Планшетов. Тесты и Новости > Новости > Архив новостей > Архив новостей за 2025 год, 05 месяц > Яндекс выпускает набор данных музыкальных рекомендаций с открытым исходным кодом Yambda
David Chien, 2025-05-30 (Update: 2025-05-30)