AAAI 2017最佳论文

发布时间:2017-02-17

    本届AAAI 大会共评出两篇最佳论文(Outstanding Paper),包括一篇最佳学生论文。其中最佳论文的荣誉归属于来自斯坦福大学计算机科学系的Russell Stewart、Stefano Drmon,他们的论文《用物理和特定领域知识让神经网络进行不带标签的监督学习》(Label-Free Supervision of Neural Networks with Physics and Domain Knowledge),采用物理学领域的启发进行AI研究,这一思路与最近圈内讨论得很多的AI研究趋势不谋而合。

| 最佳论文|

用物理和特定领域知识让神经网络进行不带标签的监督学习

作者:Russell Stewart、Stefano Drmon

来自:斯坦福大学计算机科学系

摘要:在许多机器学习应用中,带标签的数据数量稀少,要获得更多的标签造价昂贵。我们引入了一种新的神经网络监督学习方法,不是直接给出输入-输出对的直接示例,而是指定在输出空间上能够成立的约束。这些约束来源于先前的特定领域知识(domain knowledge),如已知物理定律。我们展示了这种方法在真实世界和模拟计算机视觉任务上的有效性。使用这种方法,我们在没有任何带标签的训练样本的情况下,成功训练了一个卷积神经网络来检测和跟踪对象。

| 最佳学生论文|

Option-Critic结构

作者:Pierre-Luc Bacon、Jean Harb、Doina Precup

来自McGill大学计算机科学系推理和学习实验室

摘要:时间抽象(temporal abstraction)是增强学习中对学习和规划进行扩展(scaling up)的关键。虽然我们对在时间上延伸(temporally extended)的动作进行规划有很好的理解,但从数据中自动创建这样的抽象仍然十分具有挑战性。我们在options 框架中处理这个问题[Sutton,Precup&Singh,1999; Precup,2000]。我们为option 得出了策略梯度定理,并提出了一个新的option-critic 结构,该结构能够在与policy over option 串联的情况下,同时学会选择期权的内部策略和终止条件,并且不需要提供任何额外的奖励或子目标。在离散和连续环境中的实验结果显示了该框架的灵活和高效。

来源:新智元