作者|沙丘智库研究团队
来源|沙丘社区(www.shaqiu.cn)
金融机构的数字化转型正进入深水区,系统复杂度飙升、业务迭代加速与监管压力升级的三重挑战下,传统测试模式已难以为继。金融机构普遍面临四大测试困境:
· 微服务架构下,系统接口数量动辄过万,人工测试覆盖率较低;
· 动态风控策略、结构化衍生品等业务逻辑复杂度远超人类认知边界;
· 《个人信息保护法》、《数据安全法》等要求验证数据从采集到销毁的全链路合规;
· 敏捷开发需小时级交付,但传统测试周期仍以“天”为单位。
大模型与智能测试的深度融合,正在重构金融系统的质量保障体系——从“人工验证”走向“AI驱动测试”,从“被动修复”转向“风险预判”。这一领域将成为金融机构技术竞争的下一个高地。
当前,工商银行、邮储银行等头部银行已经打造了基于大模型的智能测试系统,覆盖测试全链路的典型场景,包括测试需求分析、测试用例生成、测试脚本生成、测试报告及测试数据生成等;
证券、保险等金融机构的“大模型+智能测试”探索进程稍慢于银行业,头部证券、保险公司主要从“测试用例生成”场景切入,初步验证大模型在软件测试领域的应用价值。传统测试依赖工程师根据经验设计用例,但大模型正在改变游戏规则。通过解析需求文档、历史缺陷库、生产日志等数据,AI可自主生成超越人类想象的测试场景。
沙丘智库长期跟踪调研大模型技术的发展,旨在帮助企业快速了解大模型最新、最全面的落地情况。沙丘智库通过研究银行(中国工商银行、中国邮储银行、中信银行、华夏银行)、证券(国泰君安证券、广发证券)、保险(华农保险)等细分领域,7家标杆金融机构的“大模型+智能测试”实践,旨在为其他金融机构提供参考。
▎案例1:工商银行基于大模型的智能测试实践
为应对软件测试领域的快速版本迭代和人工经验局限问题,中国工商银行建设了基于大模型的全流程智能测试系统,涵盖测试设计、测试数据构造、安全案例推荐、业务安全检测和环境问题分析等能力场景,显著提升了测试效率、安全漏洞检测能力和问题定位速度,推动了软件测试领域的智能化转型。
完整内容:工商银行基于大模型的智能测试实践
▎案例2:中国邮储银行基于大模型的自动化测试脚本智能生成
传统的自动化测试脚本编写需要测试人员具备一定的编程能力,且耗时耗力,导致脚本编写人力成本大,质量参差不齐。
邮储银行自动化测试系统引入大模型技术,结合知识库、录制、报文解析、图像识别等技术,针对不同场景提供脚本智能生成功能:
· 单接口脚本批量生成:主要用于单接口测试,提供了单接口脚本批量生成功能,有效解决了单接口测试脚本编写量级较大的问题;
· 多接口组合场景脚本智能生成:主要用于测试业务流程,针对组合场景脚本,采用录制+智能分析+辅助编写的方案智能生成脚本;
· UI测试脚本智能生成:借助大模型技术,可以根据简单的用例描述,直接自动生成测试脚本。
基于大模型技术的自动化测试脚本智能生成功能在试点过程中取得了良好的应用效果,降低了脚本编写成本,提升了测试效率。
案例选自:沙丘智库《大模型应用跟踪月报(2024年10月)》
▎案例3:中信银行基于大模型的测试智能化转型
在降本增效实践中,中信银行信息科技条线以“测试AI助手、文档生成、需求分析”为切入点,深入挖掘各场景的核心黏滞点,提升大模型及生成式AI能力,积极探索最佳的解决方案;
中信银行在多个测试场景中实现了效率和质量的显著提升,例如在需求分析场景,模型对于需求文档的缺陷识别率可达90%以上,测试准入整体流程提效约35%,关键字标注准确率达95%以上,需求分析整体提效40%左右。
案例选自:沙丘智库《2024中国银行业大模型案例跟踪报告》
▎案例4:华夏银行利用大模型提升系统测试智能化水平
在辅助系统测试场景中,华夏银行基于大模型输出相应的测试点及测试案例。根据实测结果,大模型能够理解接口文档、生成有效的测试点,并按照测试点生成测试案例,实现采纳率和完整性达到70%左右,在辅助系统测试的应用上具备可行性。在相关研究探索的基础上,华夏银行初步构建形成了AI测试点生成工具。
案例选自:沙丘智库《大模型应用跟踪月报(2024年11月)》
▎案例5:国泰君安基于大模型的测试用例生成实践
国泰君安证券针对证券交易业务复杂性高、变革频繁导致的测试用例生成效率低、质量参差不齐等问题,提出了基于大模型的智能测试方法。通过微调预训练语言模型并结合领域知识库,实现了从交易所业务文档自动生成高质量测试用例的智能化流程。同时,构建了智能测试平台,具备业务规则识别、测试用例生成与维护等功能,显著提升了测试效率,降低了人力成本,确保了交易系统上线质量。
完整内容:国泰君安基于大模型的测试用例生成实践
▎案例6:广发证券基于大模型的测试用例生成实践
随着软件系统复杂度增加,传统功能测试方法面临效率低、覆盖面窄等问题。
为此,广发证券利用大模型强大的自然语言处理能力,通过规范业务需求描述、原子化拆分需求、生成测试要点等步骤,实现了测试用例的自动生成。团队将大模型部署于私有化环境,并集成至一站式自动化测试平台,通过HTTP API调用生成测试用例。
实践表明,大模型生成的测试用例能够覆盖业务重点流程和异常场景,显著提升了测试效率,但对输入数据质量要求较高,需进一步优化提示词和微调模型以提高准确性。
▎案例7:华农保险基于大模型的测试用例生成实践
华农保险测试团队规模约14人,每迭代需写约1000条测试用例,撰写测试用例工时占比超15%,粗略估算每年用于撰写测试用例工时超554人天,每年需撰写测试用例超26000条(迭代周期为两周)。
华农保险设计了基于大模型的测试用例生成功能,实现方案如下:
· 产品经理产出需求文档并经过评审后,将其提供给大模型1;大模型1作为资深测试工程师进行需求分析,总结测试点、潜在开发风险并阐述测试思路,然后将这些与需求文档一起,连同历史用例库中的测试用例,提供给大模型2;
· 大模型2同样作为测试工程师,依据这些生成测试用例,从而确保测试用例生成时大模型能全面理解需求并结合人的相关经验输出结果。
该产品上线三个月,调用次数达1100多次,生成2100多条用例,采纳率超35%。从不同人员采样率分布来看,超一半测试人员采纳率超40%,一定程度上助力了测试团队的日常工作。
案例选自:沙丘智库《2025年中国保险业大模型应用跟踪报告》
▎更多研究(可前往“沙丘智库”查阅)
银行业DeepSeek大模型应用跟踪报告
国资央企DeepSeek大模型应用跟踪报告
大模型应用跟踪月报(2025年1-2月)
2025年中国保险业大模型应用跟踪报告
...
*更多生成式AI研究可前往“沙丘智库”小程序查阅
*有任何需求可咨询客服微信:zimu738