作者|沙丘智库研究团队
来源|沙丘社区(www.shaqiu.cn)
本文节选自沙丘智库:《DeepSeek对全球AI市场的影响是什么?》
DeepSeek通过采用创新的MoE架构和纯基于结果的强化学习训练方法,显著降低了模型训练的成本和资源需求,为全球企业提供了新的思路,即在资源有限的情况下如何实现高效的AI应用。
DeepSeek的成功离不开如下因素:
第一,在没有商业化压力的影响下,团队越勇于追求创新的想法;
第二,在软件优化方面的专业能力,这使得DeepSeek在竞争中具有明显的成本优势;
第三,中国市场对AI发展的政策支持和生态系统的协同推动。
DeepSeek对全球AI市场产生了如下广泛影响:
(1)数据可能成为唯一的差异化因素
DeepSeek通过关注数据的使用方式而非其绝对数量,重新定义了数据在大模型中扮演的角色。以往基于过程奖励模型(PRMs)的方法在扩展时面临收益递减的问题,因为它们需要更多的监督。而DeepSeek的训练方法表明,即使没有这些限制,扩展仍然是可行的,模型效率可以通过更好的训练策略来提高,而非仅仅依赖更多的算力资源。
DeepSeek采用结果奖励强化学习(Outcome-reward RL)方法证明了通过战略性地利用数据,可以在保持低成本的同时实现更好的扩展和效率。这种方法使得复合AI技术更容易被各行各业采用,并降低了小型参与者的进入门槛。
对于采用DeepSeek的扩展方法的企业来说,算力和资源需求的降低是一个显著优势。然而,企业必须认识到,数据仍然是主要的挑战,能否获得高质量、多样化的数据将决定扩展能力和性能表现。
企业需要重视数据的获取和管理,确保能够获得适合DeepSeek模型训练的高质量数据集。解锁DeepSeek真正能力并实现下一代模型发展的关键在于获取、集成和有效利用数据(例如,通过使用元数据来监督和增强数据集成)。
(2)广泛的行业影响潜力
DeepSeek展示了在资源有限的情况下,仍然能够实现高性能AI的能力。这表明,创新和战略思维可以弥补资金和硬件资源的不足,甚至能够与资金雄厚的大型竞争对手竞争。
DeepSeek的成功为其他初创公司和小型企业提供了一个重要的参考:更多的算力资源(如GPU)并不总是必要的。通过优化训练技术和策略,可以在相同或更少的资源下实现更好的模型性能。这种方法的潜力将推动人工智能向更广泛的方向发展,甚至可能为通用人工智能的进步铺平道路。
(3)AI技术的发展路径
DeepSeek的方法强调了企业在有限条件下通过专注于软件优化而不仅仅是投资硬件进行创新的潜力。这一策略将鼓励全球的企业重新思考实现竞争优势的方法。DeepSeek的方法证明了,不依赖于传统的过程奖励模型,仅使用纯基于结果的强化学习可以有效地训练模型使其达到高性能水平,而人工智能社区之前的假设则是过程奖励模型是有效扩展模型所必需的。
(4)引发全球人工智能竞赛
人工智能竞赛不再仅仅是一场关于算力能力的比拼。DeepSeek证明,即使资源有限,算法效率也能推动突破。中国的“效率第一”人工智能模式挑战了西方的“规模第一”方法,将竞争转向现实世界的应用。
与此同时,AI民主化正在加速到来,开源模型提高了效率,使训练成本下降。随着新兴市场采用消费级GPU和众包数据,AI创新正变得更加分散,标志着从科技巨头主导地位向多极全球生态系统的转变。
▎更多研究
DeepSeek带来的变化,企业该如何应对?
2024中国大模型技术采纳现状调研报告
2024年国资央企大模型应用跟踪报告
2024年中国工业大模型应用跟踪报告
2024年AI Agent最佳实践报告
...
*更多生成式AI研究可前往“沙丘智库”小程序查阅
*有任何需求可咨询客服微信:zimu738