Détection visuelle des opportunités Détermination des séquences d'états de contact pour la manipulation d'objets
DESCRIPTION
L'objectif de la vision par ordinateur traditionnelle est, à partir d'une image ou d'une vidéo, de décrire le monde tridimensionnel représenté en termes d'objets, de structure de scène avec leurs propriétés physiques et leurs relations spatiales. Cette démarche est motivée par le besoin de représentations visuelles pour permettre des interactions fructueuses avec notre environnement et d'autres personnes. Bien qu'il s'agisse d'un aspect important de l'histoire, la recherche en sciences cognitives a démontré qu'en plus de ces représentations visuelles de la scène, la prise de contact joue un rôle central dans la compréhension des interactions entre l'homme et l'objet [1, 2]. Dans ce projet, nous nous intéressons à l'apprentissage des interactions robot-objet et à la manière dont celles-ci émergent d'une séquence d'états de contact avec l'environnement.
Le projet vise à trouver des réponses aux questions de recherche suivantes : Comment pouvons-nous apprendre des représentations visuelles informées par une compréhension abstraite des stratégies comportementales pour la prédiction des configurations de contact main-objet ? Dans quelle mesure l'environnement de l'agent détermine-t-il le développement de stratégies comportementales conduisant à de telles configurations main-objet ? Dans ce contexte, des travaux préliminaires montrent comment la compréhension de l'activité de haut niveau permet d'apprendre plus efficacement les trajectoires de mouvement futures [3].
L'hypothèse qui motive cette recherche est que les représentations visuelles, qui sont conçues avec des informations provenant de l'interaction, conduiront (I) à une réduction significative des données d'entraînement typiquement requises et (II) et permettront une meilleure généralisation puisque ces représentations sont agnostiques par rapport aux approches reposant sur une compréhension sémantique des objets.
RÉFÉRENCES
Zago, M., McIntyre, J., Senot, P. et Lacquaniti, F. (2009). Coordination visuo-motrice et modèles internes pour l'interception d'objets. Experimental Brain Research, 192, 571-604.
Tresilian, J. R. (1995). Perceptual and cognitive processes in time-to-contact estimation : Analysis of prediction-motion and relative judgment tasks. Perception & Psychophysics, 57(2), 231-245.
Halawa, M., Hellwich, O. et Bideau, P. (2022, octobre). Action-based contrastive learning for trajectory prediction (Apprentissage contrastif basé sur l'action pour la prédiction de trajectoire). In European Conference on Computer Vision (pp. 143-159). Cham : Springer Nature Switzerland.
ACTIVITÉS
Nous avons actuellement des postes de doctorants à pourvoir au sein de cette chaire de recherche.
chaire
Publié le 11 janvier 2024 Mis à jour le 19 mai 2026
prédiction de la trajectoire
estimation du mouvement
manipulation
prédiction de contact
apprentissage supervisé/non supervisé
modèles efficaces de données pour la vision
Partager le lienCopierCopiéFermer la fenêtre modalePartager l'URL de cette pageJe recommande :Consultable à cette adresse :La page sera alors accessible depuis votre menu "Mes favoris".Arrêter la vidéoLire la vidéoCouper le sonLire l'audioChat : Une question ?Chatbot Robo FabricaStatistiques de trafic MatomoX (anciennement Twitter)