Feb 24 2025 65 mins 2

上周,我们的「20问」栏目上线,非常感谢大家的支持,给了我们继续加油的动力!本周,我们继续通过 20 个问题来梳理一个领域的进展:AI 视频模型。
2024 年 2 月 15 日,Sora 惊艳登场,令业界为之瞩目。视频模型与视频生成应用迅速成为 AI 领域的焦点方向。2024 年呈现出群雄逐鹿的局面:硅谷有 Pika、Runway 和 Google 旗下的 DeepMind,国内则有海螺、可灵、Vidu、PixVerse,以及腾讯混元、字节豆包等玩家。
本期「十字路口」,我们邀请到硅谷一线的视频模型初创企业 Luma.ai 的产品经理 Barkley(他也是 Luma 这个融资了 1.6 亿美金的团队的唯一 PM)。
通过20个问题,我们将探讨这一年来AI视频模型领域的创新与变革,了解主要玩家的动向。同时,他将分享作为行业参与者,对 Sora 上线这一年来的观察,对当前工程和管理能力 v.s. 算法突破的分析,以及他人在硅谷,对大家在讨论什么,产品经理这个工作的变化的一线体会。
在聊天中,Barkley 还跟我们讲了他在 After party 上遇到 Sam Altman 并和他交流「视觉是否是通往 AGI 的必要路径」的话题。希望这次有观察有分析,也有一些行业八卦含量的内容,对大家有帮助。
ps: Barkley 曾是 Koji 在「躺岛」的出海营销实习生,我们都是典型的「跨界者」。从品牌营销、消费品、到科技互联网和 AI,这种跨界经历恰恰呼应了「十字路口」的主题:跨界思维往往能带来独特的视角和洞察,在快速迭代的AI时代,这种多元背景反而是差异化竞争力的来源。

(在时间轴中,我们没有直接列20个问题清单,而是将问题融入到与 Barkley 的对话中。这样不仅能展示问题本身,更能让大家感受到播客丰富的对谈过程。)
01:50 Barkley 个人经历:从 TikTok 特效组到在 Luma.ai 做产品经理
03:11 Sora 发布一周年,视频模型领域有哪些范式创新?
05:16 Luma 这几个月在做什么?
06:43 评估一个视频模型的依据是什么?
08:27 视频模型哪家强?目前就平衡动作幅度、一致性、美学等方面,谁做得更好一点?
09:21 Pika、Runway、DeepMind,海螺、可灵、Vidu、PixVerse 都在做什么?
13:37 硅谷怎么看国内的 AI 视频模型?
15:12 DeepSeek 的爆火,也带动更多人关注中国的视频模型
15:47 研究 or 应用,选了之后呢?
18:52 选择偏向研究的方向,商业化怎么平衡?
20:44 视频模型和文字模型,发展路径上都遵循 Scaling Law,但工程上训练模式可能有差异
22:17 通往 AGI 的必要之路是视觉吗?Barkley 在聚会上问过 Sam Altman 同样的问题
24:46 李飞飞提出的「世界模型」是什么?
26:48 「世界模型」的启发:不只是局限在生成视频,可能是 anything to anything 模型
29:53 要继续突破,工程和管理能力价值大于算法创新?
31:58 算法突破上的有哪些有意义的尝试?
33:25 做一件没有人做过的事情,没有参考样本时,必须靠大胆创新的环境推动创新发生
35:54 “我们 CEO 经常问来面试的候选人一个问题,一个从来没解决过的问题,你要怎么去做?”
36:47 最近看到的视频生成领域让人眼前一亮的使用案例是什么?
38:27 大胆预测,视频生成领域短期和长期会发生什么?
41:19 硅谷公司午餐时间,大家都在聊什么?
43:35 DeepSeek 效应
45:46 Luma.ai v.s. Runway,两个公司 CEO 在 X 上的交锋
48:58 从在 TikTok 做特效产品经理到在 Luma.ai 做模型,产品经理的角色发生了什么变化?
52:39 其他 AI 公司的产品经理在做什么?
55:02 企业招聘产品经理时的要求发生了什么变化?
58:09 身处快速变化的行业,做什么来保持学习?
59:28 身边有哪些可以借鉴的学习方法?
1:02:03 在硅谷的中国创业者,有哪些不一样的新机会?如何抓住?

欢迎订阅「十字路口」播客
🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚 AI 时代的「积极行动者」,和他们一起,探索和拥抱新变化,新的可能性。
👦🏻 主播 Koji:新世相/躺岛的联合创始人。我相信科技尤其是 AI 会在未来彻底改变社会,赋能人类,欢迎大家找我聊天,碰撞想法,链接下一个可能性。Koji 的即刻,Koji 的网站
👧🏻 主播 Ronghui:供职于科技 VC,前《第一财经周刊》驻硅谷记者,Ronghui 的即刻

欢迎加入「十字路口」的会员群
☀️ 第一手的 AI 资讯与洞察
👫🏻 鼓励大家谈恋爱/交朋友/寻找未来的同路人
🦀 添加小助理微信入群:Rwkfbcianvd ,或扫下方二维码

🎄 本播客由「新世相声音森林播客计划」支持。