Détection visuelle des opportunités Détermination des séquences d'états de contact pour la manipulation d'objets

DESCRIPTION

L'objectif de la vision par ordinateur traditionnelle est, à partir d'une image ou d'une vidéo, de décrire le monde tridimensionnel représenté en termes d'objets, de structure de scène avec leurs propriétés physiques et leurs relations spatiales. Cette démarche est motivée par le besoin de représentations visuelles pour permettre des interactions fructueuses avec notre environnement et d'autres personnes. Bien qu'il s'agisse d'un aspect important de l'histoire, la recherche en sciences cognitives a démontré qu'en plus de ces représentations visuelles de la scène, la prise de contact joue un rôle central dans la compréhension des interactions entre l'homme et l'objet [1, 2]. Dans ce projet, nous nous intéressons à l'apprentissage des interactions robot-objet et à la manière dont celles-ci émergent d'une séquence d'états de contact avec l'environnement.

Le projet vise à trouver des réponses aux questions de recherche suivantes : Comment pouvons-nous apprendre des représentations visuelles informées par une compréhension abstraite des stratégies comportementales pour la prédiction des configurations de contact main-objet ? Dans quelle mesure l'environnement de l'agent détermine-t-il le développement de stratégies comportementales conduisant à de telles configurations main-objet ? Dans ce contexte, des travaux préliminaires montrent comment la compréhension de l'activité de haut niveau permet d'apprendre plus efficacement les trajectoires de mouvement futures [3].

L'hypothèse qui motive cette recherche est que les représentations visuelles, qui sont conçues avec des informations provenant de l'interaction, conduiront (I) à une réduction significative des données d'entraînement typiquement requises et (II) et permettront une meilleure généralisation puisque ces représentations sont agnostiques par rapport aux approches reposant sur une compréhension sémantique des objets.

RÉFÉRENCES

Zago, M., McIntyre, J., Senot, P. et Lacquaniti, F. (2009). Coordination visuo-motrice et modèles internes pour l'interception d'objets. Experimental Brain Research, 192, 571-604.
Tresilian, J. R. (1995). Perceptual and cognitive processes in time-to-contact estimation : Analysis of prediction-motion and relative judgment tasks. Perception & Psychophysics, 57(2), 231-245.
Halawa, M., Hellwich, O. et Bideau, P. (2022, octobre). Action-based contrastive learning for trajectory prediction (Apprentissage contrastif basé sur l'action pour la prédiction de trajectoire). In European Conference on Computer Vision (pp. 143-159). Cham : Springer Nature Switzerland.

ACTIVITÉS

Nous avons actuellement des postes de doctorants à pourvoir au sein de cette chaire de recherche.

chaire

Publié le 11 janvier 2024
Mis à jour le 19 mai 2026

Imprimer Partager

Institut multidisciplinaire d'intelligence artificielle