Featured
05.04.22

Le Flow magique de Deezer se décline en Moods

IDOL a rencontré Benjamin Chapus, Lead Data Scientist chez Deezer. Il nous raconte comment a été conçue le Flow, une fonctionnalité exclusive de la plateforme de streaming française, désormais déclinée par Moods pour faire de belles découvertes musicales.

En tant que Lead Data Scientist chez Deezer, Benjamin Chapus s’occupe de la personnalisation de la plateforme à partir de statistiques avancées, et de machine learning. Grâce aux données collectées, chaque utilisateur de Deezer trouve une page d’accueil personnalisée qui lui ressemble en fonction des écoutes et préférences, et un Flow qui propose des recommandations adaptées.

Le Flow Deezer

Depuis 2014, Deezer offre le Flow, une fonctionnalité qui génère une bande son personnalisée. L’algorithme se base sur les préférences musicales de l’utilisateur, pour créer un mix de morceaux favoris et de découvertes adaptées. « Trop de morceaux inédits risquent de lasser l’écoute. Donc nous appliquons des règles de radio classique avec de temps en temps une chanson que l’utilisateur connaît pour rassurer l’oreille. C’est le moment idéal pour ensuite faire une découverte musicale. »

Pour Benjamin Chapus, le Flow est une sorte de playlist magique. « Sur Twitter, on lit parfois que le Flow a joué, comme par magie, un morceau qui trottait dans la tête. C’est sympa mais assez logique, parce que si la personne a cette chanson dans la tête c’est qu’elle y a été exposée, et donc la probabilité pour que le morceau arrive dans son Flow est assez forte. Parfois, il y a aussi des enchaînements assez miraculeux, hyper pointus : même en faisant exprès, nous n’y serions pas arrivé. Et parfois ce n’est pas que du hasard, parfois le Flow arrive à lire les pensées des utilisateurs, et là c’est assez magique. »

La déclinaison Flow Moods

Au départ, le Flow devait rester très simple, avec un seul bouton lecture. La promesse était forte : Deezer s’engageait à trouver ce que les gens voulaient écouter. Cependant, même si le Flow est magique, il est impossible de deviner l’humeur de l’utilisateur. Comme la musique est souvent associée à une activité, Deezer a décidé de diversifier la formule.

Avec Flow Moods, lancé en octobre 2021, l’utilisateur choisit l’humeur qui lui correspond, ce qui permet au Flow d’explorer des genres différents, avec des transitions plus souples. « Jusqu’à présent, il n’y avait que les playlists qui proposaient de la musique thématisée par rapport à un contexte. Or ce n’est pas très compliqué d’éduquer un algorithme dans ce sens, puisque les techniques de classifications musicales sont basées sur le signal audio. »

Des millions de données à analyser

Par semaine, la plateforme de streaming reçoit des centaines de millions de morceaux, que l’équipe de Benjamin Chapus doit gérer. Pour qualifier la musique, les Data Scientists peuvent se baser sur les données qui leur sont fournies, les données comportementales d’une chanson ou sur le traitement du signal.

Tout d’abord les métadonnées, fournies par les distributeurs comme IDOL ou les labels directement. « Ces données indiquent le nom de l’artiste, les genres associés à un album, ou la nationalité de l’artiste. » Puis, les données d’usage, basées sur les actions de l’utilisateur. « Par exemple, quand un morceau est mis dans plusieurs playlists de rap, et écouté par des gens qui ont l’habitude d’écouter du rap, ce sont alors, cumulés, des indices de confiance. » Enfin, le signal de la musique. « Il existe beaucoup d’algorithmes en libre accès, qui vont prémâcher le signal audio de la musique, pour extraire un certain nombre de descripteurs de haut niveau, comme les BPM, la tonalité ou le genre musical. » Ensuite, il faut recroiser ces données pour établir une recommandation adaptée.

Une grande carte de la musique

Pour consolider ces recherches, l’équipe de Benjamin Chapus envoie des robots sur le web inspecter les données publiques, sur Wikipedia, Discogs, et même des blogs musicaux comme Pitchfork. « Comme ces chroniques ont été rédigées par un humain, nous y retrouvons les influences ou les sub genres associés, ce qui élargit l’aura d’un album. »

Dans les dizaines de milliers d’albums reçus chaque jour, tout n’est pas éligible à l’algorithme. Ca ferait beaucoup trop de données à traiter, il faut faire un tri. « On reçoit beaucoup de déchets, comme des rééditions, parfois des chansons libres de droit, ou encore des bruits : de plage, d’oiseaux, ou d’aspirateur. Il faut savoir faire remonter ce qui est important, d’où l’intérêt de vérifier si un album a de l’écho dans l’actualité musicale. »

Tous ces éléments permettent de positionner le morceau sur une grande carte de la musique. « On ne peut pas généraliser un style pour un artiste, qui peut avoir une signature musicale diverse au cours de sa carrière. Ce sont toutes ces subtilités que nous essayons de capter, pour des recommandations pertinentes. »

Un design minimaliste

Plus on écoute de la musique, et plus la recommandation est adaptée. Car à chaque action sur la plateforme, on indique nos goûts à l’algorithme. Sur le Flow, il n’y a que peu de boutons : lecture, avance, retour, et surtout like et ban. Ces deux derniers boutons sont les signaux principaux pour renseigner le Flow.

Sur le profil de l’utilisateur, l’équipe de Data Science analyse toutes les écoutes, en se basant sur cette grande carte de la musique, avec des grands continents de style de musique, qui parfois se rejoignent. « Tous ces éléments nous permettent de définir trois ou quatre centres d’intérêts musicaux, et le Flow va jongler entre ces barycentres du profil. Si la personne a tendance à skipper beaucoup de chansons proposées, le Flow va changer de style musical. »

Quand une personne bannit un artiste ou une chanson, le Flow établit une sorte de blacklist tout en essayant de comprendre si c’est cet artiste qui pose problème ou le style. « On teste, un peu à la manière d’une bataille navale, en visant juste à côté. Petit à petit, l’apprentissage s’opère, en fonction des actions, et le Flow essaie de converger le plus rapidement possible, vers ce que les gens ont envie d’écouter. »

Les tests grandeur nature

L’avantage de travailler sur une plateforme comme Deezer, c’est que l’équipe de Data Science va pouvoir réaliser des tests à grande échelle pour étudier les comportements des utilisateurs. Mais aussi, d’aiguiser les algorithmes sur les playlists réalisées en interne. « Nous avons une très grande équipe éditoriale qui élabore beaucoup de playlists thématiques, ce qui rend le travail de sélection très facile. »

Car pour créer une playlist “motivation” adaptée, il faut présenter à l’algorithme des chansons “motivation” de tous les styles musicaux. Cette collection de données peut être très fastidieuse. « Et le fait d’avoir cette sélection éclectique, exhaustive et variée, est un véritable atout. Une fois cette curation effectuée, la partie algorithme est assez simple à dérouler. »

Lire plus d'articles