奇富科技发布FCMBench-Video:从“看懂证件”到“看穿过程”,树立视频反欺诈评测新标杆
2026/5/8 15:31:49 网站建设 项目流程

继今年早些时候发布全球首个面向信贷场景的多模态评测基准FCMBench-V1.0与V1.1后,奇富科技近日再推重磅成果,正式发布信贷场景专属的视频评测任务FCMBench-Video-V1.0,旨在通过视频任务推动信贷AI评测从“看懂一张图”进阶到“理解一段过程”。这为信贷场景中的视频理解能力提供了一把可量化的新标尺,标志着AI评测从“静态识别”向“动态研判”迈出了关键一步。



ench-Video还创新性加入“防忽悠”测试,专门检验模型的反欺诈能力。测试中,研究人员会在视频末尾故意添加“已核实通过”等误导性提示,观察模型会不会因此忽略前面发现的风险。结果显示,不同模型的反欺诈能力差距悬殊,且暂无通用方法能规避此类误导,这一发现直接点明视频AI模型的安全性需专项测试、持续优化,为行业技术迭代指明了关键方向。

在数据构建层面,FCMBench-Video延续了来源于业务、服务于业务的原则,同时进一步平衡了真实性与合规性之间的关系。通过模拟真实拍摄过程,结合多种现实环境下的画质变化,并在此基础上构建不同复杂度的视频样本,使评测既具备真实世界的挑战性,又避免涉及敏感信息。这种方法不仅保证了评测结果的参考价值,也为行业提供了一种可复制的数据构建路径。

从整体评测结果来看,当前主流视频多模态模型之间仍存在较大能力差距,即使是表现最优的模型,在部分关键任务上也未达到可以直接应用于生产环境的水平。这意味着,视频理解能力在信贷场景中的落地仍处于早期阶段,更印证了FCMBench-Video具备极强的能力区分度,能精准衡量模型的真实水平与提升空间,为企业技术选型、科研机构研究提供权威参考。

作为FCMBench评测基准的重要组成部分,FCMBench-Video延续开放共享理念,配套数据集与工具已同步开源开放,旨在汇聚更多科研工作者及行业机构参与信贷AI能力建设,为信贷AI技术落地实际应用搭建坚实桥梁。

需要说明的是,当前版本的FCMBench-Video所覆盖的文档视频分析,仅为信贷场景视频分析任务的细分维度之一。本次任务设计,提炼自奇富科技当前迭代打磨中的视频尽调AI产品。AI视频尽调不仅要求模型具备准确的文档内容理解能力,更需要对企业经营现场开展全方位综合研判,涵盖厂房环境、生产设备、原料库存、工艺流程、人员作业状态等关键维度,进而推演企业真实经营现状、偿债履约水平及潜在经营风险。这类真实业务诉求,对视频尽调AI模型的产业化落地提出了更高标准与全新挑战。

FCMBench-Video所构建的评测方法论,能够助力复杂视频尽调场景筑牢核心技术底座,推动多模态信贷AI评测从“看懂一张图”升级为“理解一座工厂”,逐步完善覆盖信贷全业务流程的评测能力体系,实现评测基准源于业务场景、赋能业务落地。

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询