Intelligence Artificielle

Entité Mystérieuse Investit 60 Millions de Dollars dans Reddit pour Entraîner une IA avec les Publications des Utilisateurs

Entité Mystérieuse Investit 60 Millions de Dollars dans Reddit pour Entraîner une IA avec les Publications des Utilisateurs
<p>
    <figcaption class="article-featured-image-caption">
        UKRAINE - 2021/03/07 : Sur cette illustration photographique, on voit une main silhouette tenant un téléphone mobile avec le logo de Reddit en arrière-plan. (Illustration par Pavlo Gonchar/SOPA Images/LightRocket via Getty Images) <em>Image : Pavlo Gonchar/SOPA Images/LightRocket via Getty Images</em>
    </figcaption>
</p>

Reddit et IA : Le choc des données

Actuellement, le secteur de l’IA est en pleine effervescence, mais au cœur de ce mouvement se cache une ressource précieuse : les données. Celles-ci, générées par des utilisateurs humains, sont essentielles pour entraîner des modèles massifs comme ChatGPT et DALL-E, capables de produire des textes et des images.

Cette forte demande en données engendre une multitude de conflits. Des auteurs et organisations de presse se battent en justice, affirmant que leurs œuvres ont été utilisées par des entreprises d’IA sans leur accord. Par ailleurs, une question cruciale se pose : que se passera-t-il lorsque l’Internet sera inondé de contenus générés par l’IA ? Les créateurs d’IA devront-ils s’appuyer sur ces mêmes contenus pour former de futurs modèles ?

Les transactions : un nouveau marché

Cette quête de contenu humain alimente également de nouvelles transactions commerciales. Les développeurs d’IA cherchent désespérément à acquérir des réserves de travaux humains pour entraîner leurs systèmes. Un exemple frappant de cela est le récent accord révélé par Bloomberg : une entreprise d’IA, dont le nom reste secret, a accepté de verser 60 millions de dollars par an à Reddit en échange de l’accès à sa vaste base de données d’entrées utilisateurs. Cela souligne l’importance des données des utilisateurs dans cette ruée vers l’or numérique.

A lire :  Chatbot NYC : Encouragement controversé pour les petites entreprises

La réciprocité en question

Ce n’est pas la première fois qu’une entreprise d’IA débourse de l’argent pour accéder à un réservoir de contenus textuels. Rappelons qu’Axel Springer, propriétaire de nombreux médias tels que Politico et Business Insider, a conclu un accord avec OpenAI pour intégrer le contenu de ses publications dans ChatGPT.

Cependant, il existe des différences notables. Les journalistes sont rémunérés pour leur travail, même si l’utilisation de ce dernier dans des systèmes d’IA peut ne pas leur apporter de bénéfices. En revanche, les utilisateurs de Reddit partagent leurs contributions par passion, une réalité qui risque de les frustrer lorsque leurs créations sont utilisées à des fins lucratives sans compensation.

Réactions de la communauté

La communauté Reddit a réagi avec ironie face à cette situation. Un utilisateur a lancé : « Où est ma part ? » en réponse à l’annonce de l’accord, tandis qu’un autre a noté que « lorsqu’on utilise quelque chose gratuitement, c’est que l’on est le produit ». La situation est d’autant plus étonnante que, malgré les millions échangés, l’identité de l’acheteur reste pour l’instant inconnue.

Conclusion : un avenir incertain

L’éthique de l’utilisation des données est un sujet de débat constant, surtout lorsque des sommes aussi importantes sont en jeu. Les utilisateurs de forums publics mettent en lumière la nécessité d’une compensation pour l’utilisation de leurs contributions, soulignant ainsi le dilemme que représente l’accès aux données dans le développement de l’IA.

FAQ

Quels sont les principaux enjeux liés aux données dans l’IA ?

Les enjeux incluent la propriété intellectuelle, la rémunération des créateurs de contenu, et l’impact sur la qualité et l’intégrité des informations disponibles.

A lire :  Le Conseil d'OpenAI en Ébullition Avant le Licenciement d'Altman

Comment les entreprises d’IA obtiennent-elles les données ?

Elles le font en signant des contrats avec des plateformes comme Reddit, ou en utilisant des contenus accessibles publiquement sans rémunération des créateurs.

Quelle est la réaction des utilisateurs face à l’utilisation de leurs données ?

De nombreux utilisateurs expriment des préoccupations éthiques et demandent une compensation pour leurs contributions. Certains considèrent qu’ils deviennent des « produits » de la technologie gratuite.

Y a-t-il des lois régissant l’utilisation des données personnelles ?

Oui, de nombreuses juridictions ont des lois sur la protection des données, comme le RGPD en Europe, qui visent à protéger les droits des utilisateurs concernant la collecte et l’utilisation de leurs données.

Quelles alternatives existent pour les entreprises d’IA ?

Certaines entreprises explorent l’utilisation de contenus sous licence ou mettent en place des programmes de rémunération pour les contributeurs afin de créer une base de données éthique et durable.