Une initiative de préservation musicale
Un groupe de hacktivistes appelé Anna’s Archive, dédié à la préservation de contenus musicaux non autorisés, a récemment annoncé avoir trouvé un moyen de sauvegarder presque l’intégralité de Spotify.
Des chiffres impressionnants
Dans un billet de blog décrivant leur démarche, ces archivistes affirment avoir archivé l’audio d’environ 86 millions de morceaux, représentant 99,6 % des écoutes sur cette plateforme de streaming. De plus, ils ont collecté des métadonnées de presque l’ensemble de la bibliothèque de Spotify, qui pèse environ 300 téraoctets et contient 256 millions de titres, provenant de 15,43 millions d’artistes et 58,6 millions d’albums.
Une base de données inédite
Selon eux, ce travail constitue la plus grande base de données de métadonnées musicales publiquement accessibles à ce jour et marque le début d’un véritable archive de préservation musicale.
La préservation de la musique face aux tendances actuelles
Bien que la musique populaire soit relativement bien conservée par rapport à d’autres médias comme les livres ou les articles, les hacktivistes soulignent que les collections de préservation actuelles privilégient principalement les chansons commerciales les plus populaires. Ces choix négligent souvent des œuvres moins connues, comme la musique artistique expérimentale, et se concentrent sur des formats de haute qualité.
La réaction de Spotify
De leur côté, les responsables de Spotify n’ont pas caché leur mécontentement quant à cette initiative. Un porte-parole a déclaré que la plateforme avait identifié et désactivé les comptes utilisateurs impliqués dans ce grattage illégal de données. Ils ont également mis en place des mesures de sécurité pour détecter et prévenir ce genre de comportement, affirmant leur engagement à protéger les droits des créateurs.
Une analyse précieuse
En plus des fichiers audio, les hacktivistes ont également trié et analysé les métadonnées des chansons, offrant ainsi une vue d’ensemble unique sur le catalogue Spotify, accessible auparavant uniquement aux entités internes de la plateforme. Par exemple, ils ont révélé une statistique étonnante : les trois chansons les plus écoutées sur Spotify totalisent plus de écoutes que les 20 à 100 millions de morceaux les moins populaires réunis.
La question des contenus générés par IA
Cette situation soulève la question de la proportion de la bibliothèque Spotify composée de contenus générés par intelligence artificielle. Les artistes humains expriment leur inquiétude face à ce phénomène, affirmant qu’il obscurcit leur visibilité sur la plateforme. Les hacktivistes estiment que si l’on filtré pour ne garder que les chansons créées par des humains, le nombre d’écoutes serait probablement beaucoup plus élevé.
Un débit colossal de données
Les hacktivistes mentionnent qu’en capturant les chansons ayant moins de 1 000 écoutes, la taille totale du jeu de données aurait dépassé 700 téraoctets. Cependant, cela aurait offert peu d’avantages pratiques, car il aurait été difficile de distinguer les morceaux générés par IA des créations humaines.
La diversité musicale sur Spotify
Concernant les genres, ils ont noté que les artistes de musique électronique représentent près de 25 % des musiciens présents sur la plateforme, suivis par le rock, la musique traditionnelle, le Latin, le rap, la pop, et enfin le classique.
En conclusion
Bien que cette initiative de scraping de Spotify marque une avancée significative pour la préservation de la musique, elle ne couvre qu’une partie de l’immense diversité musicale qui existe dans le monde. Néanmoins, les hacktivistes sont d’accord pour dire que c’est déjà un bon début.
FAQ
Qu’est-ce qu’Anna’s Archive?
Anna’s Archive est un groupe de hacktivistes qui se consacre à la préservation et à l’archivage de contenus musicaux numériques, notamment sur des plateformes comme Spotify.
Pourquoi Spotify s’oppose-t-il à ce projet?
Spotify craint que le grattage de données n’endommage sa plateforme et ses relations avec les artistes. Ils considèrent cela comme une violation des droits d’auteur.
Quel impact a l’IA sur la musique sur des plateformes comme Spotify?
L’IA génère de plus en plus de morceaux, ce qui pourrait éloigner les artistes humains en inondant le marché de contenus moins authentiques.
Quelle est l’importance de la préservation de la musique?
La préservation de la musique aide à maintenir une archive historique et culturelle, garantissant ainsi que les œuvres passées puissent être écoutées et étudiées par les générations futures.
Comment les hacktivistes ont-ils réussi à collecter autant de données?
Ils ont développé des programmes pour gratter et compiler les métadonnées et les fichiers audio à partir de la bibliothèque de Spotify, en contournant certaines des restrictions mises en place par la plateforme.
