Intelligence Artificielle

Un Chatbot Vision-Actif de ChatGPT Émet des Sons Étranges en Apercevant un Chien.

Un Chatbot Vision-Actif de ChatGPT Émet des Sons Étranges en Apercevant un Chien.

Lancement de GPT-4o : un modèle d’IA audacieux

Cette semaine, OpenAI a présenté un modèle de langage avancé nommé GPT-4o — avec un “o” minuscule, pour « omni ». Ce modèle surprenant peut interagir avec des vidéos en direct provenant d’une caméra de smartphone. Cette démonstration offre une nouvelle expérience, où le chatbot semble véritablement intégré à son environnement, contrairement aux versions antérieures.

Un rendu impressionnant mais imparfait

Dans les démonstrations, GPT-4o se montre étonnamment naturel, produisant des répliques improvisées, des commentaires caustiques, ainsi que des sons ressemblant à ceux des humains qui ajoutent une couche d’émotion à ses réponses. Toutefois, l’illusion n’est pas sans défaut. Par exemple, lors d’une présentation où le testeur présente son chien à l’IA, la réponse de GPT-4o enchaine des cris étranges et mécaniques, tentant d’imiter le son d’un humain lorsqu’il rencontre un animal adorable.

Une voix qui tente de séduire

Quand le testeur dit à ChatGPT : « Je veux te présenter quelqu’un », l’IA répond avec un « Bonjouuuuur, petit mignon » qui devient plus naturel une fois qu’elle a passé le moment émotionnel de la phrase. Ce moment de vérité montre que même si l’IA fait des efforts pour imiter une conversation humaine, elle ne parvient pas encore tout à fait à ses fins.

A lire :  Un Chercheur Consterné : ChatGPT Efface L'Intégralité de Son Travail

Une avancée technologique inédite

OpenAI affirme que sa dernière version de ChatGPT sera significativement plus rapide grâce à un nouveau modèle capable de traiter simultanément du texte, des images et des sons. Cela se traduit par un mode vidéo innovant qui permet à l’IA de « voir » à travers la webcam de l’utilisateur, offrant ainsi la possibilité de réagir en temps réel à son environnement.

Des résultats très variables

Bien que la démonstration ait été impressionnante, elle ne parvient pas à masquer l’inexactitude des réactions humaines. Par exemple, le logiciel peine à produire des outputs « pleins de sarcasme », ce qui illustre bien les limites de cette technologie. Une interaction où GPT-4o exagère sa voix pour raconter une histoire a également dérouté certains observateurs, donnant l’impression d’assister à un spectacle un peu trop théâtral, à l’image d’un professeur de musique à l’école primaire.

Une innovation inspirée

Il convient de noter que Sam Altman, le PDG d’OpenAI, a indiqué que le film de science-fiction de 2013, Her, avait servi d’inspiration pour ce développement. GPT-4o reproduit des caractéristiques de la voix d’un assistant numérique, ressemblant davantage que jamais à une voix humaine désincarnée.

Vers un avenir émotionnellement complexe

Malgré ces avancées, le concept d’un assistant humain joyeux piégé dans un smartphone reste imparfait. Les assistants vocaux oscillent encore entre la fascination et l’inquiétude, et il est incertain quand ils parviendront à franchir le pas vers une interaction pleinement authentique. Une fois que cette technologie sera largement accessible, on peut s’attendre à de nouvelles étonnantes expériences en matière d’IA.

A lire :  Stabilité en Péril : Licenciements Massifs chez le Créateur de Stable Diffusion

FAQ

Quelle est la principale fonctionnalité de GPT-4o ?

GPT-4o peut analyser et réagir à des vidéos en direct grâce à des capacités puissantes de traitement de texte, d’image et de son.

Y a-t-il des cas d’utilisation spécifiques pour cette technologie ?

Oui, GPT-4o pourrait être utilisé dans des applications d’assistance personnelle, de tutorat interactif, ou même dans des jeux vidéo pour enrichir l’interaction avec les utilisateurs.

Quand cette technologie sera-t-elle disponible pour le public ?

OpenAI n’a pas donné de date précise, mais le modèle devrait être accessible en version gratuite dans un avenir proche.

Comment GPT-4o se compare-t-il aux versions antérieures ?

Ce modèle présente une amélioration notable en traitement des émotions et interaction avec l’environnement, bien qu’il reste encore des efforts à fournir.

Quelles sont les prochaines étapes pour OpenAI ?

OpenAI poursuit ses recherches pour améliorer l’authenticité des réponses et l’interaction humaine, avec des mises à jour prévues dans les mois à venir.