Des Coûts Élevés
Le modèle o3 récemment présenté par OpenAI est considéré comme le plus puissant de tous les temps, mais il présente un inconvénient majeur : son coût d’exploitation est très élevé, comme le rapporte TechCrunch.
Une Approche Innovante
Lancé il y a juste une semaine, le modèle o3 utilise une technique appelée calcul de test en temps réel, ce qui signifie qu’il nécessite plus de temps pour “réfléchir” et examiner plusieurs options avant de fournir une réponse. Les ingénieurs d’OpenAI espèrent ainsi que ce modèle produira des résultats de meilleure qualité face à des requêtes complexes, évitant ainsi des conclusions hâtives.
Des Résultats Prometteurs
Les premiers résultats montrent que cette approche porte ses fruits. En mode d’utilisation maximale, o3 a obtenu un score impressionnant de 87,5 % sur l’échelle de référence ARC-AGI, qui évalue les modèles linguistiques. Ce score est presque trois fois supérieur à celui de son prédécesseur o1, qui s’élevait à seulement 32 %.
Les Débuts Coûteux
Cependant, cette méthode de réflexion approfondie entraîne des coûts exorbitants. Pour atteindre ce score record, o3 a consommé plus de 1 000 dollars de puissance de calcul par tâche, soit plus de 170 fois la consommation d’une version moins puissante de o3. Pour contexte, o1 coûtait moins de 4 dollars par tâche.
Un Changement de Paradigme
Ces dépenses embrouillent quelque peu les affirmations de l’industrie affirmant que les performances d’o3 infirment les craintes selon lesquelles l’amélioration des modèles d’IA par le biais de l’augmentation de la puissance de traitement et des données d’entraînement a atteint un plafond.
Les Gains Difficiles à Ignorer
D’un côté, le fait qu’o3 ait obtenu un score presque trois fois plus élevé que o1, qui a été lancé seulement trois mois auparavant, semble indiquer que les progrès de l’IA ne ralentissent pas. Cependant, la critique concernant le scaling évoque des rendements décroissants. Bien que les améliorations ici soient en grande partie dues à la façon dont le modèle fonctionne, les coûts sont trop significatifs pour être négligés.
Un Coût Relatif
Même la version moins puissante d’o3, qui a tout de même obtenu un score notable de 76 %, a coûté environ 20 dollars par tâche. Bien que cela paraisse abordable comparé aux normes actuelles, c’est encore plusieurs fois plus cher que ses prédécesseurs. Avec ChatGPT Plus se vendant à 25 dollars par mois, la question reste de savoir à quel point ce produit pour les utilisateurs pourra progresser sans freiner les finances d’OpenAI.
Des Performances Élevées au Prix Fort
Dans un article de blog discutant des résultats du benchmark, François Chollet souligne qu’o3 se rapproche des performances humaines, mais que cela “vient à un prix élevé et n’est pas encore économiquement viable.”
“Pour résoudre des tâches ARC-AGI, on pourrait payer un humain environ 5 dollars par tâche (nous le savons, nous l’avons fait)”, a-t-il noté, “tout en dépensant à peine quelques centimes en énergie.”
Bien qu’il soit convaincu que “le rapport coût-performance s’améliorera considérablement dans les mois et les années à venir”, cela reste à confirmer. Actuellement, o3 n’est pas encore disponible au public, avec une version “mini” prévue pour janvier.
FAQ
Comment fonctionne le modèle o3 d’OpenAI ?
Le modèle o3 utilise une technique de calcul de test en temps réel, lui permettant d’évaluer plusieurs possibilités avant de fournir une réponse.
Pourquoi les coûts d’opération d’o3 sont-ils si élevés ?
Les coûts élevés résultent de la puissance de calcul nécessaire pour atteindre des performances optimales, dépassant les 1 000 dollars par tâche dans son mode le plus puissant.
Quelle est la différence entre o1 et o3 ?
O3 offre une amélioration significative des performances par rapport à o1, avec un score de 87,5 % contre 32 % pour le modèle précédent.
Les gains d’IA sont-ils en ralentissement ?
Bien que les scores d’o3 suggèrent une amélioration continue, la critique du scaling indique que cela peut entraîner des rendements décroissants à mesure que les coûts augmentent.
Quand le modèle o3 sera-t-il accessible au public ?
Actuellement, il n’est pas disponible, mais une version “mini” est attendue pour lancement en janvier.
