作者|沙丘智库研究团队
来源|沙丘社区(www.shaqiu.cn)
DeepSeek大模型作为国内外领先的推理模型之一,凭借其强大的深度推理能力和性能突破,正在为银行业带来前所未有的技术红利。但与此同时,新技术的出现也使银行从业者产生疑惑:
· 银行如何应对DeepSeek所引发的新一轮推理模型革命?
· 银行应该怎样部署DeepSeek?聚焦哪些应用场景?如何更新技术栈?
· DeepSeek大模型当前在银行业的落地进展如何?是否已有产生效果的实践案例?
为了解答上述问题,沙丘智库发布《银行业DeepSeek大模型应用跟踪报告》,通过本报告,我们希望为银行从业者以及决策者提供一份关于银行业DeepSeek大模型应用的全面洞察,助力银行业在智能化转型中把握先机,实现技术与业务的深度融合。
以下内容节选自:沙丘智库《银行业DeepSeek大模型应用跟踪报告》(31页PPT)(可前往“沙丘智库”查阅)
01
DeepSeek大模型引发推理革命
2024年9月,OpenAI 发布了深度推理模型o1,将大模型能力从概率推算推进到深度推理。o1模型的关键特征是通过思维链(CoT)过程增强推理能力,使其能够将复杂问题分解为更小、更易管理的步骤,代表了人工智能在复杂推理任务上的里程碑式进展。
DeepSeek R1的发布则是深度推理模型领域的另一个重要里程碑,DeepSeek R1同样展现出媲美o1的强大推理能力,但以极低的成本(相较于其他模型)实现,且采取权重开源、宽松许可,赋能给全球开发者。
当前,DeepSeek官方发布的DeepSeek系列模型共有8个,包括:
· 1个通用基础模型DeepSeek-V3,DeepSeek官方宣称V3模型训练仅花费557.6万美元,但未包含前期技术积累、隐性投入及长期基础设施成本,即使如此也远低于其他大模型的开发成本;
· 1个满血版推理模型DeepSeek-R1,基于DeepSeek V3进一步训练得到,拥有最大的参数量(671B)、性能最强;
· 6个蒸馏版推理模型DeepSeek-R1-Distill,在DeepSeek-R1输出的基础上,通过知识蒸馏技术压缩大型模型(Qwen、Llama等开源模型)得到的版本,参数量大大减少(1.5B-70B),且硬件适配性更高。
02
银行业DeepSeek大模型部署应用情况
DeepSeek的开源特性推动银行业形成“技术普惠”生态,大型银行通过矩阵化部署巩固优势,中小银行则获得低成本缩小技术差距的机会,整体加速银行业数字化转型进程。根据沙丘智库调研与统计,截止目前至少有21家银行部署应用DeepSeek大模型。
· 从部署方式上看,大部分银行选择本地化部署。虽然DeepSeek降低了大模型使用成本,但数据安全和隐私要求这一核心约束依然存在,基于数据隐私和安全的考虑,银行(尤其是大型银行)仍然会选择自行搭建大模型技术体系,而不是完全使用外部服务。但对银行来说,DeepSeek R1的私有化部署周期明显缩短(从过去方案的6-8周缩短到2-3周),微调数据需求也从百万级样本降低到十万级样本;
· 从部署类型上看,以DeepSeek R1蒸馏版32B和70B居多。32B和70B模型更适合企业级应用,部署成本在几十万。部分头部银行会选择部署满血版671B模型;
· 从应用场景上看,当前银行主要是利用DeepSeek增强原有大模型应用场景的逻辑推理能力。例如邮储银行利用DeepSeek增强企业级问答“小邮助手”的服务能力。DeepSeek R1目前尚未在银行的业务场景中产生颠覆性创新应用,但作为一款低成本的开源推理模型,其技术特性与潜力将重塑银行业AI落地的想象空间。
03
银行业DeepSeek应用典型案例
以工商银行为例,基于“工银智涌”大模型平台,工商银行引入DeepSeek系列开源模型,应用于财报分析助手、AI财富管家、业绩考评等多个场景,提升复杂数据处理与推理能力,推动业务流程智能化。
在网络金融对公业绩考评场景,工商银行基于DeepSeek R1大模型,通过“数据自动收集、业绩智能评价、评价精准推送”,实现业绩数据一站式加工、督导评价智能化生成。DeepSeek大模型输出了更加有针对性、准确性更高的总分行业务发展策略建议,业务采纳率达到90%。
* 以上内容节选自沙丘智库《银行业DeepSeek大模型应用跟踪报告》
///
完整报告:沙丘智库《银行业DeepSeek大模型应用跟踪报告》(31页PPT)(可前往“沙丘智库”查阅)
报告目录
第一部分 DeepSeek大模型技术洞察
1.1 大模型发展进入深度推理时代
1.2 国内外厂商发布的推理模型梳理
1.3 DeepSeek系列模型对比
1.4 从DeepSeek R1看推理模型的进化路径
1.5 DeepSeek R1的性能突破
1.6 DeepSeek大模型的局限性
第二部分 银行业应对DeepSeek的策略建议
2.1 推理模型带来的提示词思路变化
2.2 银行业DeepSeek部署应用情况
2.3 银行业DeepSeek大模型建设路径
2.4 银行业DeepSeek大模型短期应用场景
2.5 银行业DeepSeek大模型中长期应用场景
2.6 大模型技术栈与DeepSeek的结合思路
第三部分 银行业DeepSeek应用典型案例
3.1 中国工商银行:网络金融对公业绩考评
3.2 中国工商银行:对公营销AI问答助手
3.3 中国邮政储蓄银行:增强“小邮助手”服务能力
3.4 江苏银行:智能合同质检和自动化估值对账
附录 21家银行DeepSeek大模型部署应用情况
▎更多研究(可前往“沙丘智库”查阅)
2025年中国保险业大模型应用场景评估报告
2024中国大模型技术采纳现状调研报告
2024中国银行业大模型应用场景评估报告
2024年中国银行业大模型案例跟踪报告
2024年AI Agent最佳实践报告
2024年“大模型+RAG”最佳实践报告
...
*更多生成式AI研究可前往“沙丘智库”小程序查阅
*有任何需求可咨询客服微信:zimu738