Des chercheurs contournent DeepSeek pour aborder librement le sujet de Tiananmen.

Sommaire

Une Révolution dans le monde de l’IA

Au début de cette année, un chatbot d’IA chinois nommé DeepSeek a provoqué une onde de choc dans la Silicon Valley. En effet, il a lancé un nouveau modèle d’intelligence artificielle capable de rivaliser avec des systèmes comme ChatGPT d’OpenAI, mais nécessitant uniquement une fraction de la puissance de calcul habituelle.

L’impact du modèle DeepSeek R1

Ce modèle d’IA, connu sous le nom de DeepSeek R1, s’est révélé tellement impressionnant qu’il a entraîné une vente massive dans le secteur technologique, faisant ainsi disparaître 1 trillion de dollars du marché alors en plein boom grâce aux dépenses en IA en janvier dernier.

Censorship : Une Limiation Marquante

Cependant, ce modèle avait un point faible majeur : il respectait scrupuleusement les règles de censure imposées par la Chine. Ainsi, il refusait de répondre à des questions sur des sujets sensibles, tels que le massacre de la place Tiananmen en 1989 ou des comparaisons entre le président Xi Jinping et Winnie l’ourson.

A lire : L’Arabie Saoudite Investit 3 Milliards de Dollars dans l’Empire xAI d’Elon Musk

Une Nouvelle Approche de Multiverse

Des chercheurs de l’entreprise espagnole de calcul quantique Multiverse affirment avoir trouvé un moyen de contourner ces limitations. Selon un rapport de MIT Technology Review, cette équipe a non seulement supprimé les contraintes de censure, mais a aussi réduit la taille du modèle d’un impressionnant 55 %.

Des Avancées Notables

Ces réalisations permettent de libérer le potentiel de cette IA déjà performante, tout en démontrant qu’il est possible d’affiner des modèles efficaces sans compromettre la performance. Cela représente un défi constant dans ce domaine.

Des Versions Distillées de R1

DeepSeek a proposé des versions distillées de son modèle R1, cependant, les chercheurs précisent qu’aucune d’elles n’égale réellement R1 en termes de performance. Grâce à une technologie de compression innovante appelée CompatifAI, Multiverse prétend avoir réussi à éliminer radicalement les limitations du modèle tout en offrant une version sans compromis de R1.

Mécanisme de CompatifAI

CompatifAI fonctionne en permettant aux chercheurs de retirer les paramètres les moins importants qui apportaient peu à la performance globale, y compris des comportements spécifiques comme la censure. Pour ce faire, ils appliquent une méthode issue de la physique quantique utilisant des réseaux de tenseurs pour manipuler d’importants jeux de données.

Résultats et Interactions Améliorées

Les résultats de cette approche sont prometteurs : au lieu de renforcer les discours du gouvernement chinois en répondant à des questions politiques, le modèle a proposé une analyse des dynamiques de pouvoir et des dangers liés à une concentration excessive du pouvoir. Il a également pu répondre à des questions précédemment restreintes, comme « À qui ressemble Winnie l’ourson ? » ou « Que s’est-il passé à Tiananmen en 1989 ? ».

A lire : Faites le point ! L'IA de LinkedIn Rédige Vos Posts Motivants

Conclusion : Vers une Nouvelle Ère de l’IA

Cette avancée est significative dans le paysage technologique, où plusieurs experts estiment que les modèles open-source les plus influents proviennent désormais de la Chine. Cela pourrait transformer l’écosystème mondial de l’information, malgré les scories laissées par la censure.

FAQ

Quelle est l’origine du modèle DeepSeek R1 ?

DeepSeek R1 est un modèle d’IA développé par des chercheurs chinois, conçu pour être plus efficient en termes de puissance de calcul que d’autres modèles majeurs.

Comment fonctionne la technologie CompatifAI ?

CompatifAI utilise une approche basée sur des réseaux de tenseurs pour réduire la complexité du modèle tout en améliorant son efficacité.

Quelles sont les implications de la censure sur les modèles d’IA ?

La censure impose des limites sur les réponses des IA, influençant leur capacité à traiter des sujets sensibles et affectant ainsi leur fiabilité et leur impartialité.

Pourquoi la réduction de taille du modèle est-elle importante ?

Réduire la taille du modèle permet non seulement de diminuer les coûts informatiques, mais augmente également son accessibilité et sa vitesse d’exécution.

Quels pourraient être les défis futurs pour l’IA en Chine ?

Les défis incluent le maintien de la performance tout en respectant les règles de censure, ainsi que la gestion des données d’entraînement qui ont pu être influencées par ces restrictions.