Notebookcheck Logo

Yandex publie Yambda, un ensemble de données de recommandations musicales en libre accès

L'ensemble de données gratuit Yahdex Yambda permet à chacun de créer son propre service de recommandation musicale. (Source de l'image : Yandex)
L'ensemble de données gratuit Yahdex Yambda permet à chacun de créer son propre service de recommandation musicale. (Source de l'image : Yandex)
Yandex a publié Yambda, le plus grand ensemble de données ouvertes au monde pour les systèmes de recommandation musicale, contenant 4,79 milliards d'interactions anonymes d'utilisateurs pour aider les développeurs à créer des services musicaux intelligents qui ne diffusent que les chansons que les auditeurs veulent entendre.

Yandex a publié son ensemble de données open-source Yambda contenant des informations sur les préférences des auditeurs de musique en vue de la création d'un service de streaming audio similaire à Spotify avec personnalisation des listes de lecture par l'IA.

Les services de streaming tels que Spotify, Tidal et Qobuz utilisent des algorithmes logiciels ou des modèles d'intelligence artificielle pour créer des listes de lecture basées sur les préférences individuelles. Ces services ne divulguent généralement pas leur code ou leurs modèles, car leur capacité unique à jouer automatiquement des chansons appréciées par les auditeurs est considérée comme un secret commercial à l'origine de leur succès.

Yandex a recueilli des données sur dix mois sous la forme de 4,79 milliards d'interactions d'utilisateurs avec 9,39 millions de morceaux de musique à partir de son pool de 28 millions d'utilisateurs mensuels Yandex Music d'utilisateurs mensuels. Ces données comprennent des informations clés sur les auditeurs de Yandex Music - ce qu'ils choisissent d'écouter, ce qu'ils aiment et ce qu'ils n'aiment pas. Toutes les interactions sont horodatées pour plus de précision.

L'ensemble de données peut être téléchargé en cinq milliards (1 million d'utilisateurs), cinq cent millions (100 000 utilisateurs) et cinquante millions (10 000 utilisateurs) de modèles d'événements, le maximum nécessitant au moins 85 Go d'espace de stockage. L'ensemble de données est stocké dans le format Apache Parquet , un format de données orienté colonnes un format de fichier de données orienté colonnes pour faciliter l'analyse et la recherche.

Les lecteurs peuvent offrir de la musique en streaming avec une carte cadeau Spotify.

Please share our article, every link counts!
Mail Logo
> Revues et rapports de ordinateurs portatifs et smartphones, ordiphones > Archives des nouvelles 2025 05 > Yandex publie Yambda, un ensemble de données de recommandations musicales en libre accès
David Chien, 2025-05-30 (Update: 2025-05-30)