AI智慧秀 浙大李玺团队:指代表达理解新方法,ScanFormer粗到细迭代消除视觉冗余 作为基础的视觉语言任务,指代表达理解(referring expression comprehension, REC)根据自然语言描述来定位图中被指代的目标。