#79. 强化学习——阿尔法围棋背后的技术

嘉宾:田博士(Facebook人工智能研究院的研究员及经理) 主持:斯图亚特 剪辑:王立冰

本期内容包括:

  • 嘉宾在前阿尔法狗时代研发的世界顶级围棋AI
  • 阿尔法狗使用的技术
  • 阿尔法狗之后围棋AI的进展
  • 强化学习是什么
  • 强化学习的历史
  • 强化学习的落地方向和挑战
  • 两种强化学习:有模型的和无模型的
  • 强化学习的研发体验
  • 强化学习的未来发展方向
  • 进入强化学习领域需要做哪些准备

图片截取自 “japanese robot plays igo” by hiroaki maeda on Flickr https://www.flickr.com/photos/torisan3500/372829860 Licensed under CC BY-ND 2.0 https://creativecommons.org/licenses/by-nd/2.0/

片头片尾音乐 Courante 1st Cello Suite Exzel Music Publishing (freemusicpublicdomain.com) Licensed under Creative Commons: By Attribution 3.0 http://creativecommons.org/licenses/by/3.0/