En savoir plus
Google et l’évolution des robots
Les robots ont traditionnellement évolué selon des instructions précises. Cependant, Google vise à faire en sorte qu’ils deviennent capables de vraiment comprendre leurs actions.
L’annonce récente de Gemini Robotics-ER 1.6 marque une étape importante dans la conception d’un modèle d’intelligence artificielle destiné à aider les machines à mieux interpréter leur environnement réel. Ce modèle permet également de planifier des tâches et d’évaluer la terminaison d’une activité.
La notion de « raisonnement incarné »
Ce système se base sur le concept de « raisonnement incarné », ce qui signifie que les robots peuvent établir un lien entre ce qu’ils perçoivent et ce qu’ils doivent accomplir. L’usage de plusieurs caméras et d’indicateurs du monde réel optimise leur compréhension de l’espace. Google facilite l’accès au modèle via son API Gemini et son AI Studio, afin d’assister les développeurs œuvrant dans les domaines de la robotique et de l’automatisation.
Vers une autonomie réelle
Google a affirmé que Gemini Robotics-ER 1.6 améliore la manière dont les robots perçoivent et interprètent leur environnement. Ce modèle renforce le raisonnement spatial, permettant aux machines de reconnaître les objets, de les compter et de saisir les relations entre eux.
Selon Interesting Engineering, cette mise à jour introduit également le raisonnement multi-vues. Cela permet aux robots de combinées diverses sources d’alimentation visuelle, par exemple des caméras surplombantes et des caméras montées sur les poignets. Cette compétence est cruciale dans des environnements réels et dynamiques où la visibilité peut être limitée ou en constante évolution.
De plus, le modèle autorise les interactions en langage naturel, offrant ainsi la possibilité aux utilisateurs de formuler des tâches complexes en utilisant un langage simple et de les décomposer en étapes plus petites.
Un pont entre digital et physique
D’après le blog officiel de Google DeepMind, l’architecture du modèle a été pensée comme un système « axé sur le raisonnement », facilitant la transition entre l’intelligence numérique et l’action physique.
De nouvelles fonctionnalités pour le secteur industriel
Cette mise à jour apporte des fonctionnalités pratiques adaptées aux environnements d’entreprise. Parmi les plus notables se trouve l’interprétation des instruments, qui permet aux robots de lire des jauges, des verres d’observation et des affichages numériques couramment utilisés dans les installations industrielles.
Marco da Silva, vice-président et directeur général de Spots chez Boston Dynamics, a commenté l’importance de ces avancées : « Des capacités telles que la lecture d’instruments et un raisonnement des tâches plus fiable permettront à Spot de percevoir, comprendre et réagir aux défis du monde réel de manière totalement autonome. »
Google a observé des améliorations significatives dans ce domaine, avec une précision de lecture d’instrument ayant grimpé de 23 % dans les anciens modèles à 93 % avec les nouvelles capacités de vision.
Ce modèle affine également la planification des tâches, la sensibilité à la sécurité et la manière dont les robots interagissent avec différents objets, augmentant leur fiabilité dans des contextes réels.
Impact sur la robotique d’entreprise
Gemini Robotics-ER 1.6 incarne une transformation dans le domaine de la robotique. Les systèmes passent d’un cadre rigide d’instructions à une approche plus flexible, réagissant ainsi plus efficacement aux conditions réelles.
Ce changement pourrait influencer de nombreux secteurs, tels que la fabrication, la logistique, l’énergie et la gestion des installations. Les robots équipés de compétences avancées en matière de raisonnement pourront effectuer des inspections, naviguer dans des environnements complexes et s’adapter plus aisément aux conditions changeantes.
Google a rendu le modèle disponible aux développeurs à travers son API et AI Studio, leur permettant de tester et d’innover plus rapidement. L’entreprise encourage également la collaboration avec divers partenaires pour affiner le modèle en vue de cas d’utilisation spécifiques.
FAQ
Quels sont les avantages de Gemini Robotics-ER 1.6 ?
Ce modèle permet de meilleures interactions entre les robots et leur environnement, augmentant leur autonomie et leurs capacités d’adaptation.
Comment les robots utilisent-ils le raisonnement multi-vues ?
Les robots utilisent plusieurs caméras pour combiner des perspectives différentes, améliorant ainsi leur compréhension des scènes complexes et en évolution rapide.
Où les développeurs peuvent-ils accéder à Gemini ?
Les développeurs peuvent accéder à ce modèle via l’API Gemini et l’AI Studio de Google.
Quels secteurs pourraient bénéficier de ces avancées ?
Les secteurs tels que la fabrication, la logistique et l’énergie pourraient particulièrement tirer profit de ces technologies avancées.
Comment la lecture d’instruments impacte-t-elle la performance des robots ?
La capacité à lire avec précision des instruments permet aux robots de fonctionner de manière plus autonome et efficace dans des environnements industriels.
