围绕 DeepSeek-R1 ,极客公园「今夜科技谈」直播间讨论,深入探讨了多个关键话题。
首先,针对 DeepSeek 文笔好这一现象,分析出原因包括未过度追求安全对齐、有资深人士参与数据撰写、模型规模增大等。
其次,R1 思维链透明清晰,是首个完整展示思维链的模型,其思维链由强化学习涌现,基模质量对其影响重大。
再者,即便有了更好的模型,AI 应用开发难度并未降低,因为模型能力提升拉高了基线,创业者需寻找新可能;同时,R1 对 AI 产业影响深远,推动多 agent 协作发展,降低推理成本,引发 AI 应用新变化。
此外,蒸馏对大小模型都有利,可助力端侧模型和垂类应用发展;DeepSeek 开源带来巨大品牌和商业收益,改变了开源观念;R1 实现低成本训练得益于系统优化,对英伟达短期利空、中期利好、长期利空;
最后,对于 DeepSeek 未来,推测其可能专注技术迭代、人才招募,在追求极致智能和拓展数据、训练方法上发力。
Leave a Reply