论文地址:http://openaccess.thecvf.com/content_cvpr_2018/papers/Misra_Learning_by_Asking_CVPR_2018_paper.pdf
摘要
我们介绍一个交互式的学习框架来发展和测试智能视觉系统,叫做学习通过询问(LBA)。我们挖掘LBA在内容上,关于视觉问题回答(VQA)任务。LBA不同于标准的VQA训练,在很多问题上,其中不被注视在训练过程中,学习者必须询问问题,它想回答的。因此,LBA比较贴近模仿自然学习和有潜在的较多有效数据比传统VQA集。我们展示了一个模型,能够表现LBA在CLEVR数据集上,以及表明它是自动发现一个由易到难课程,当学习交互从一个对话中。我们的LBA生成数据和有较多有效样本。我们也展示我们的模型问问题,普遍是先进的比VQA模型,新颖的在测试时间分配上。
LBA范例
LBA系统架构
不同迭代次数下