本期节目我们请到了大语言模型的专家Mengdi来给我们介绍一些大语言模型是怎么回事,DeepSeek有什么特别之处,以及大语言模型的推理能力等话题。
嘉宾:Mengdi
主播:斯图亚特、Vindy、Cat
策划:斯图亚特
剪辑&时间线:季雨清
- 00:00:59 从支持向量机到强化学习
- 00:04:45 All in大模型
- 00:06:17 什么是大语言模型
- 00:09:43 ChatGPT时刻
- 00:10:20 为什么被称为语言模型
- 00:14:16 ChatGPT如何大力出奇迹
- 00:20:51 ChatGPT时刻后的创新
- 00:23:19 DeepSeek
- 00:26:19 业内怎么看DeepSeek的出圈点
- 00:28:20 为什么是OpenAI
- 00:29:20 为什么推理依靠强化学习
- 00:30:35 推理是否可以泛化
- 00:39:07 推理泛化的局限
- 00:43:34 推理的未来
- 00:45:30 什么是蒸馏
- 00:52:37 DeepSeek对当前研究的影响
- 00:56:00 大模型领域的发展方向
- 00:58:49 AI Agent
- 00:59:21 通用人工智能
- 01:01:54 未来科研怎么走
- 01:05:00 AI应用
- 01:06:40 进入AI核心圈需要做什么准备
关于「牛油果烤面包」
「牛油果烤面包」播客入选2020苹果最佳播客,获得年度编辑推荐,聊科技发展趋势,聊各行业来龙去脉。我们坐标硅谷,邀请第一线的资深专家分享给大家听!
欢迎您在每期节目下方给我们留言,和我们的主播互动交流,或是添加微信小助手nygkmb2022,加入微信听友群。如果您对我们的志愿者工作有兴趣,请点击 这个链接 看我们的招募帖;你有什么有趣的话题,想来作牛油果烤面包的嘉宾,或是对节目有任何的意见或建议,欢迎发邮件和我们联系。我们的邮件地址是:[email protected]
图片: Generated by Dall-E
片头片尾音乐:
Courante 1st Cello Suite
Exzel Music Publishing (freemusicpublicdomain.com)
Licensed under Creative Commons: By Attribution 3.0
http://creativecommons.org/licenses/by/3.0/