Feb 13 2025 67 mins
在上一期 Vol.11. 【漫谈AGI】DeepSeek炸场硅谷:属于中国大模型的GPT时刻是如何炼成的? 的节目中,我们与大家详细聊了聊DeepSeek对美国科技界的冲击与两位主播对DeepSeek的粗略看法。
DeepSeek火爆出圈的另一面,也引发了创投圈对于AGI范式的广泛讨论。背靠量化公司的DeepSeek,无疑成为了这条赛道上一条巨大的鲶鱼,不同于传统互联网公司的AGI研发模式,DeepSeek所代表的“量化模式”无疑为未来的AGI研发模式带来了崭新的可能性。
在本期【漫谈AGI】中,让我们来从研发模式和技术角度来详细聊聊,DeepSeek所代表的“量化模式”与OpenAI及一众大厂所代表的“互联网模式”的优劣得失,以及哪个模式可以带领人们通向最终的AGI道路。
本期《半球观察》,与您相约。
【本期您将听到】
PART 0 写在前面:一些硬核技术播客节目的推荐与分享
0:05 本期播客事前说明与硬核技术播客推荐
PART 1 DeepSeek引发的LLM技术路线之争
00:03:29 Dense Model与MoE的架构之争,MoE架构技术简析
00:10:49 MLA(多头潜在注意力机制)技术简析 (DeepSeek V2)
00:16:42 美国的显卡禁运,CUDA的护城河与国产卡之争
PART 2 量化公司和互联网公司的优劣
00:25:35 互联网公司和量化公司的技术栈区别
00:27:54 量化交易公司在做什么?相比于互联网公司,量化公司也许更技术更Geek
00:31:02 互联网模式和量化模式,研发AGI/大模型会有什么不同?
00:49:30 MTP(多Token预测)与FP08技术简析(DeepSeek V3)
PART 3 各国对DeepSeek的政治围堵
00:55:32 各国政府对DeepSeek的态度变化
00:59:40 硬件与人才的围堵违背硅谷精神,并不会真正奏效
01:04:11 主播们对未来政治围堵的看法
也欢迎收听我们 Vol.06. 特朗普再当选,会开启制裁新纪元吗?聊一聊历史上的各种制裁 这期节目了解更多关于制裁的内容
出场人物:阿P,P特
剪辑:P特
文本:P特
欢迎添加两位主播的微信号 philgroup、Peter-Banqiu或者小🍠搜索“半球观察”加入听友群与我们互动~