Immervision, co-fondateur et vice-président de la technologie, Patrice Roulet Fontani s’est entretenu avec Jim Beretta du podcast Robot Industry pour discuter des « systèmes de vision et de la technologie de vision profonde pour les robots ».

Un système de vision robotique permet essentiellement à un robot de « voir ». Ou comme on dit chez Immervision « un système de vision robotique apporte des yeux aux machines ». Ces systèmes de vision sont reliés à un ordinateur qui traite les images afin que le robot puisse interpréter ce qu’il voit. Cela permet au robot de suivre les instructions pour effectuer des tâches telles que l’identification, la navigation, l’inspection et la manipulation d’objets et d’articles.

Chez Immervision, nous travaillons à changer la façon dont les robots voient le monde !|

Immervision a commencé à développer une expertise dans le grand angle et la haute résolution utilisée pour concevoir des caméras et des objectifs pour la vision humaine où la principale préoccupation est d’obtenir la meilleure image et d’augmenter la résolution pour avoir des couleurs vives et des images nettes. Au cours des 20 dernières années, Immervision a utilisé son expérience pour apporter la vision à tous les types de machines et a conçu des yeux pour les caméras de surveillance, la surveillance automobile, les caméras d’action, les véhicules itinérants lunaires, les drones volants, les téléphones, les ordinateurs portables et bien sûr les robots.

Récemment, les dernières tendances en matière de systèmes de vision observées par l’entreprise sont une demande accrue de vision par ordinateur, et ces exigences sont très différentes des besoins de vision humaine.

Qu’il s’agisse d’un véhicule autonome ou d’un chien robot rôdant dans les rues pour communiquer des messages, les robots accomplissent une grande variété de tâches, permettant l’expansion des capacités et des performances humaines dans le monde réel. Ces tâches nécessitent une supervision et une planification au-delà des simples tâches cognitives. Cela présente les deux plus grands défis pour les systèmes de vision robotique.

Le premier défi auquel sont confrontés les systèmes de vision robotique est la combinaison de nombreuses utilisations qui nécessitent que les robots aient une double vision des capacités humaines et de la machine. Cela nécessite un double cortex qui s’interface avec les besoins de vision du robot et de l’homme, qui ne sont pas toujours alignés.

Patrice explique « Immervision maîtrise l’ensemble du pipeline du système de vision robotique et comment optimiser la conception des yeux en fonction du résultat que nous voulons atteindre. Nous continuons à rechercher quelle est la meilleure conception qui maximise l’efficacité de l’apprentissage automatique et de l’IA. Nous appliquons ensuite cette recherche à la robotique, ainsi qu’à l’automobile et à d’autres industries. »

Le deuxième défi est la latence – comment pouvez-vous capturer l’environnement, le traiter et extraire les bonnes informations pour le reste du pipeline ? Non seulement cela doit être fait efficacement, mais aussi rapidement, car plus le pipeline est rapide, plus le robot peut se déplacer et prendre des décisions rapidement. Beaucoup pensent que cette latence peut être réduite par des programmes électroniques ou informatiques – mais cela commence par l’objectif, l’objectif doit être rapide pour capturer plus de lumière dans un court laps de temps. Immervision apporte ici des réalisations sans précédent, car non seulement nous rendons le pipeline complet rapide, mais aussi l’objectif. Ces données de meilleure qualité et ces algorithmes efficaces sont essentiels pour permettre aux robots de percevoir leur environnement, une exigence pour permettre l’autonomie.

Dans l’industrie robotique d’aujourd’hui, il n’y a pas de caméra unique qui puisse correspondre aux yeux humains en termes d’adaptabilité, de résolution, de sensibilité et de plage dynamique. Même si une machine déploie une grande variété de capteurs (caméra, radar, lidar/ToF, sonar, thermique, microphone, etc.) qui peuvent surpasser les capacités humaines dans de nombreux cas, il existe toujours des limites. Par exemple, actuellement, une caméra ne peut pas atteindre les performances de l’œil humain à la même vitesse qu’un humain peut donner un sens à l’entrée d’images. La vision humaine est très efficace et, en combinaison avec la puissance du cerveau humain, elle peut donner un sens à une entrée d’image en quelques fractions de secondes, tandis qu’un système de vision doit corréler les informations provenant de l’entrée d’image, des capteurs auxiliaires et des algorithmes d’IA pour faire le même travail. Traiter avec plusieurs capteurs peut conduire à des conclusions contradictoires.

Pour trouver une solution de système de vision robotique, il faut une entreprise unique et visionnaire comme Immervision qui a été la première à introduire des lentilles biologiques de forme libre qui combinent un champ de vision super grand angle avec une résolution augmentée. Ayant passé les deux dernières décennies à travailler avec les technologies optiques de pointe telles que les méta-lentilles, la société a toujours repoussé les limites de la détection et de la perception par machine.

Écoutez le podcast complet.