Annonce du modèle d’OpenAI
Jeudi dernier, OpenAI a dévoilé son modèle d’intelligence artificielle tant attendu, dont le nom de code est “Strawberry.” La société dirigée par Sam Altman a suscité de grandes attentes avec cette annonce, affirmant que son modèle “o1-preview” pourrait rivaliser avec des étudiants en doctorat sur des tâches complexes dans des domaines comme la physique, la chimie et la biologie.
Nouvelles capacités et attentes
Avec cette nouvelle technologie prétendument dotée de compétences de raisonnement proches de celles des humains, OpenAI assure que ce modèle est capable d’aborder des problèmes complexes de manière plus efficace. Toutefois, des premiers tests réalisés par des utilisateurs ont mis en lumière que, malgré ces promesses, il reste encore très loin de pouvoir remplacer un scientifique ou un programmeur humain.
Difficultés rencontrées par les utilisateurs
Des publications récentes sur les réseaux sociaux montrent que l’o1-preview a du mal avec des tâches élémentaires. Par exemple, un chercheur de l’INSA Rennes, Mathieu Acher, a constaté que le modèle suggérait encore des coups d’échecs illégaux pour répondre à certaines énigmes.
Même les calculs de base, comme le fait de compter, semblent poser problème. Dans une situation rapportée par le scientifique de Meta AI, Colin Fraser, le modèle a tenté de résoudre un jeu de mots lié à un agriculteur transportant des moutons, mais s’est finalement perdu en fournissant une réponse illogique.
Problèmes de précision et temps de réponse
Lors d’un autre essai, l’entrée d’un problème logique portant sur une fraise — utilisé par OpenAI dans sa démonstration — a produit des réponses très variables parmi les utilisateurs. L’un d’eux a révélé que, dans 75 % des cas, le modèle fournissait la mauvaise réponse à ce prompt.
Certaines critiques indiquent même que l’IA a encore du mal avec un problème linguistique basique : compter le nombre de fois que la lettre “R” apparaît dans le mot “strawberry.”
OpenAI a précisé, dès le départ, que son dernier modèle est encore une oeuvre en développement. La société a souligné que l’o1-preview ne disposait pas encore de fonctionnalités essentielles, comme la navigation sur le web ou le téléchargement de fichiers et d’images, qui font la force de modèles comme GPT-4o.
Innovations et temps de traitement
L’introduction d’un nouveau processus de réflexion est l’une des principales innovations qui distinguent l’o1-public de ses prédécesseurs comme GPT-4o. Au lieu de donner une réponse immédiate, le nouveau modèle prend le temps d’élaborer des réponses itératives avant de conclure, ce qui peut allonger considérablement le temps de réponse. Par exemple, un utilisateur a rapporté que le modèle a mis 92 secondes pour donner une réponse à une devinette, mais a ensuite commis une erreur dans sa réponse.
Noam Brown, scientifique de recherche chez OpenAI, a défendu cette approche en soutenant que le fait de prendre son temps pourrait mener à des réponses révolutionnaires dans le futur. Il a exprimé l’idée que, pour des versions ultérieures, l’IA pourrait passer des heures, voire des jours, à élaborer des réponses complexes.
Réactions et critiques
Ces aspirations n’ont pas manqué de susciter des réactions critiques, notamment de Gary Marcus, un commentateur éminent dans le domaine de l’IA. Selon lui, suggérer que faire fonctionner le modèle pendant des semaines ou des mois pourrait produire des résultats révolutionnaires, comme un nouveau médicament contre le cancer, est irréaliste. Marcus a également souligné que le modèle montre encore des lacunes dans des tâches simples, telles que le jeu de tic-tac-toe.
Conclusion et implications
Alors qu’OpenAI continue de recevoir des financements massifs, avec un objectif de 6,5 milliards de dollars, la communauté et les investisseurs restent vigilants face à la somme d’argent injectée dans cette technologie. Beaucoup s’interrogent également sur son impact environnemental. Le fait que ce dernier modèle se heurte encore aux mêmes défis basiques n’est pas spécialement rassurant.
OpenAI semble toutefois déterminé à insister sur le fait qu’il ne s’agit que du début, le nom du modèle symbolisant un redémarrage. Avec les difficultés rencontrées dès le départ, ce nom pourrait finalement se révéler très approprié.
FAQ
Quelle est la principale innovation apportée par le modèle “Strawberry” ?
Le modèle introduit un nouveau processus de “chaîne de pensée” qui lui permet de proposer des réponses plus élaborées en prenant le temps de réfléchir, au lieu de donner une réponse immédiate.
Pourquoi OpenAI dit-il que son modèle est encore en développement ?
La société a souligné que le modèle ne possède pas encore certaines des fonctionnalités essentielles, comme la recherche sur Internet ou le téléchargement de fichiers, qui sont disponibles dans d’autres modèles comme GPT-4o.
Quels types de problèmes le modèle “Strawberry” peine-t-il à résoudre ?
Des utilisateurs ont rapporté que le modèle a des difficultés avec des tâches basiques, telles que le dénombrement de lettres ou la résolution de problèmes simples comme les coups d’échecs légaux.
Quel est le point de vue des critiques concernant ce modèle ?
Des experts comme Gary Marcus soulignent que les promesses d’OpenAI concernant les avancées révolutionnaires du modèle ne sont pas réalistes et que certaines des erreurs continuellement commises démontrent ses limites actuelles.
Quelles seront les implications financières de la sortie de ce modèle ?
OpenAI cherche à lever des fonds massifs alors que scepticismes et préoccupations concernant l’impact environnemental de l’IA grandissent au sein de la communauté technologique et parmi les investisseurs.
