Vision-Language Models

ThinkGrasp: A Vision-Language System for Strategic Part Grasping in Clutter

We have developed ThinkGrasp, a plug-and-play vision-language grasping system for heavy clutter environment grasping strategies.

We develop an approach for efficient open-vocabulary language-conditioned manipulation policy learning.