技术小站8

网站首页 互联网 > 正文

谷歌的DeepMind正在利用神经网络探索多巴胺在学习中的作用

2022-02-19 10:13:27 互联网 来源:
导读 深度学习算法可以在很多领域超越人类,从分类图像、读唇语到预测未来。然而,虽然他们的熟练程度超出平均水平,但他们的学习速度处于劣势。

深度学习算法可以在很多领域超越人类,从分类图像、读唇语到预测未来。然而,虽然他们的熟练程度超出平均水平,但他们的学习速度处于劣势。例如,一些最好的机器学习算法需要数百个小时才能掌握典型的电子游戏,而这些游戏普通人一个下午就能学会。

根据谷歌子公司DeepMind发表在《自然神经科学》杂志上的论文,这可能与神经递质多巴胺有关。

元学习,即从例子中快速学习,并随着时间的推移从这些例子中得出规则的过程,被认为是人类比计算机更有效地获取新知识的原因之一。然而,关于元学习的潜在机制却知之甚少。

为了理解这一过程,伦敦DeepMind的研究人员使用递归神经网络来模拟人类生理,这种神经网络可以将动作和观察结果内化,并从训练中获得经验。网络对预测误差信号进行奖励,随着时间的推移,数学优化算法通过试错3354站在多巴胺上,多巴胺影响情绪、大脑中的化学运动、痛苦和快乐的感觉,并认为它在学习过程中起着关键作用。

研究人员在六个神经科学元学习实验中放松了该系统,并将其性能与接受相同测试的动物进行了比较。其中一项名为“哈洛实验”的测试要求算法在两张随机选择的图像中进行选择,其中一张与奖励有关。在最初的实验中,受试者(一群猴子)很快学会了选择对象的策略。第一次随机选择一个对象,然后第二次选择一个与奖励相关的对象,然后每次都这样。

这种算法的性能与动物实验非常相似,它会根据从未见过的新图像做出与奖励相关的选择。此外,研究人员指出,学习发生在循环神经网络中,这支持了多巴胺在元学习中发挥关键作用的理论。

即使当权重(两个神经网络节点之间的强度,类似于大脑中一个放电神经元对另一个神经元的影响)被冻结时,人工智能系统的性能也是一样的。在动物中,多巴胺被认为通过加强前额叶皮层的突触连接来加强行为。然而,研究人员表示,神经网络行为的一致性表明,多巴胺也可以传递和编码关于任务和规则结构的信息。

DeepMind团队在一篇博文中写道:“长期以来,神经科学家一直在前额叶皮层观察类似的神经活动模式,前额叶皮层具有快速的适应性和灵活性,但一直很难找到足够的解释来解释为什么会出现这种情况。”“前额叶皮层并不依靠缓慢的突触重量变化来学习规则结构,而是使用直接编码在多巴胺中的抽象的基于模型的信息,这为其多样性提供了更令人满意的理由。”

如上图,DeepMind的神经网络将注意力转向与奖励相关的图像。

当然,人工智能系统模仿人类生物的想法并不新鲜。荷兰Radboud大学研究人员进行的一项研究发现,递归神经网络可以预测人类大脑如何处理感官信息,尤其是视觉刺激。但在很大程度上,这些发现为机器学习提供了信息,而不是神经科学研究。

例如,去年,DeepMind使用互补算法构建了一个部分解剖的人脑模型:这是一个模仿前额皮质行为的神经网络,以及一个扮演海马体角色的“记忆”网络。因此,人工智能机器明显优于大多数神经网络。最近,DeepMind将注意力转向了所谓的“思维机器”,并创建了一个合成神经网络,可以将类似人类的推理技能和逻辑应用于问题解决。

这篇论文的作者写道,多巴胺研究表明,医学从神经网络研究中受益不亚于计算机科学。

DeepMind团队写道:“用人工智能的见解来解释神经科学和心理学的发现,凸显了每个领域可以为其他领域提供的价值。”“展望未来,我们期望通过从脑回路中的特定组织获得指导,并设计新的模型来加强学习科目的学习,可以从相反的方向获得很多好处。”


版权说明: 本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。


标签:




热点推荐
热评文章
随机文章