Vol.12.【漫谈AGI】从DeepSeek聊聊通向AGI的模式之争:量化向左,互联网向右


Episode Artwork
1.0x
0% played 00:00 00:00
Feb 13 2025 67 mins  

在上一期 Vol.11. 【漫谈AGI】DeepSeek炸场硅谷:属于中国大模型的GPT时刻是如何炼成的? 的节目中,我们与大家详细聊了聊DeepSeek对美国科技界的冲击与两位主播对DeepSeek的粗略看法。

DeepSeek火爆出圈的另一面,也引发了创投圈对于AGI范式的广泛讨论。背靠量化公司的DeepSeek,无疑成为了这条赛道上一条巨大的鲶鱼,不同于传统互联网公司的AGI研发模式,DeepSeek所代表的“量化模式”无疑为未来的AGI研发模式带来了崭新的可能性。

在本期【漫谈AGI】中,让我们来从研发模式和技术角度来详细聊聊,DeepSeek所代表的“量化模式”与OpenAI及一众大厂所代表的“互联网模式”的优劣得失,以及哪个模式可以带领人们通向最终的AGI道路。

本期《半球观察》,与您相约。

【本期您将听到】

PART 0 写在前面:一些硬核技术播客节目的推荐与分享

0:05 本期播客事前说明与硬核技术播客推荐

PART 1  DeepSeek引发的LLM技术路线之争

  • 00:03:29 Dense Model与MoE的架构之争,MoE架构技术简析

  • 00:10:49 MLA(多头潜在注意力机制)技术简析 (DeepSeek V2)

  • 00:16:42 美国的显卡禁运,CUDA的护城河与国产卡之争

PART 2  量化公司和互联网公司的优劣

  • 00:25:35 互联网公司和量化公司的技术栈区别

  • 00:27:54 量化交易公司在做什么?相比于互联网公司,量化公司也许更技术更Geek

  • 00:31:02 互联网模式和量化模式,研发AGI/大模型会有什么不同?

  • 00:49:30 MTP(多Token预测)与FP08技术简析(DeepSeek V3)

PART 3  各国对DeepSeek的政治围堵

出场人物:阿P,P特

剪辑:P特

文本:P特

欢迎添加两位主播的微信号 philgroup、Peter-Banqiu或者小🍠搜索“半球观察”加入听友群与我们互动~