译者:AI研习社(季一帆)
双语原文链接:‘Must-Read’ AI Papers Suggested by Experts – Pt 2
我们之前写了一篇文章,向大家推荐了一些AI必读论文,引起很好的反响。现在,我们推出了第二篇文章。这次推荐的论文依然是分量十足、诚意满满,各位推荐者都认为自己推荐的论文是AI人员必读的经典之作,不知各位读者怎么看。现在,我们来看看这次入选的是哪些论文吧!
不过在这之前,我还是向您推荐我们之前的那一篇文章,那篇文章也绝对值得一读。
推荐人:MILA博士研究员,Alexia Jolicoeur-Martineau
推荐论文1:f-GAN: Training Generative Neural Samplers using Variational Divergence Minimization (f-GAN: 使用变分散度最小化训练生成神经采样器)- Sebastian Nowozin et al.
https://arxiv.org/pdf/1711.04894.pdf
Alexia提出可以将若干分类器视为估计f散度,于是,GAN可以被解释为最小化估计和散度。在论文中,Microsoft Research的研究人员详细介绍了相关工作、论文方法和实验验证。阅读原文获取更多信息。
推荐论文2:Sobolev GAN – Youssef Mroueh et al.
https://arxiv.org/pdf/1711.04894.pdf
本文将WGAN-GP中的梯度范数惩罚视为约束鉴别器,从而使其unit-ball具有梯度。论文的数学论证极其复杂,但我们只要记住,关键在于可以对鉴别器添加各种各样的约束。这些限制条件可以防止鉴别器过分严格。论文中的Table1非常重要,我曾数次翻阅该论文,只为查看Table1,该表显示了可用的各种不同约束。阅读原文获取更多信息。
推荐人:DeepMind高级研究员,Jane Wang
老实说,我并不会觉得有哪篇论文要比其他论文更重要,因为我认为所有论文都是相互依存的,而科学是协作的成果。但还是要说,就我个人而言,还是会更加偏爱一些论文的,从这些论文中我受益匪浅,但这并不是说其他论文不好。这只意味着,我个人比较喜欢以下两篇论文。
推荐论文1:Where Do Rewards Come From? (奖励从何而来?)- Satinder Singh et al.
本文提出了一种通用的奖励计算框架,在给定适应度函数和环境分布的情况下,该框架给出了最优奖励函数的概念。实验结果表明,在此最佳奖励函数中,传统的外在和内在行为概念均有体现。阅读原文了解更多信息。
推荐论文2:Building machines that learn and think like people (让机器向人类一样学习与思考)- Brenden Lake et al
本文回顾了认知科学的进展,表明要想实现真正像人类一样学习和思考的机器,需要当前研究的创新性改进。具体来说,我们认为这样的机器应具有以下能力:1)建立可解释的、可理解的世界因果模型,而不仅仅是解决模式识别问题;2)在物理学和心理学层面进行学习,以支持和丰富机器所学知识;3)利用相关性以及学会学习使机器快速获取知识,并扩