第 14 章. 案例研究 1:金融服务——GlobalBank 的实时欺诈检测
本作品已使用人工智能进行翻译。欢迎您提供反馈和意见:translation-feedback@oreilly.com
第13章的引言中描述了笔记本模型与生产系统之间的差距。现在,我们将具体了解GlobalBank是如何弥合这一差距的——以及在此过程中遇到的意外情况。
注
本章中的所有代码示例均已通过 AutoGluon 1.4.0 进行测试和验证。如需完整的实现、详细输出、实验变体以及其他高级技术,请参阅 配套的 Jupyter 笔记本Supplementary_Code_A_Fraud_Detection.ipynb。
AutoGluon 正在积极开发中。请访问AutoGluon 官网获取最新的文档和安装说明。
业务问题与背景
2023年,的全球支付欺诈损失超过320亿美元,其中在线交易欺诈是增长最快的领域。对于GlobalBank这家每日处理5000万笔交易的大型金融机构而言,欺诈检测不仅关乎防止损失,更是公司业务生存的基础。
GlobalBank 面临着多重挑战的“完美风暴”:
| 挑战 | 描述 |
|---|---|
| 速度要求 | 为避免购物车放弃,需在 100 毫秒内完成支付决策。 |
| 极端类不平衡 | 仅有 0.08% 的交易属于欺诈(每 1,250 笔中仅有 1 笔)。 |
| 不断演变的欺诈模式 | 欺诈者不断调整策略,因此需要能够检测新型攻击模式的模型。 |
| 客户体验 | 误报导致客户不满和收入损失。 |
| 合规 | 金融法规要求决策具有可解释性,并保留完整的审计轨迹。 |
其传统的基于规则的系统产生了过多的误报(误报率高达4.2%),同时却未能识别出日益复杂的欺诈模式。这对业务造成了严重影响:
-
该系统每年因欺诈造成的损失达320万美元
-
因误报而被拦截的合法收入达180万美元
-
因支付体验摩擦导致的客户流失
-
每年因争议交易的人工审核成本达85万美元
成功标准
高管团队为自动机器学习(AutoML)项目制定了明确的目标:
-
将欺诈损失减少50%(目标节省160万美元)
-
将误报率降低 40%(提升客户体验)
-
保持 <100 毫秒的预测延迟(不影响结账体验)
-
为合规监管和客户服务提供可解释的决策
-
将 80% 的欺诈检测自动化(减轻人工审核负担)
本案例研究展示了AutoGluon如何通过一套完整的端到端实施方案——该方案融合了前几章中的几乎所有概念——帮助GlobalBank实现了这些目标。
数据管道与预处理
欺诈检测 需要实时整合多源数据——任何数据质量问题都可能导致误报(惹恼客户)和漏报(漏检欺诈)。GlobalBank 的数据来自七个不同的银行系统,每个系统都有各自的格式、时间戳规范和数据质量问题。
该管道需要处理:
-
多源数据集成:交易数据、客户画像、设备指纹、商户信息
-
数据质量验证:在异常数据破坏模型之前进行检测
-
基于时间的分割:对欺诈检测至关重要——随机分割会导致数据泄露
-
极端类不平衡:0.08% 欺诈率(每 1,250 笔交易中仅 1 笔)
数据管道架构
完整的数据管道实现展示了几个关键模式。
1. 多源数据集成
完整的数据管道实现展示了若干关键模式,这些模式将生产环境中的欺诈检测与学术研究区分开来。现实中的欺诈检测需要整合多源数据:交易记录提供核心事件,客户画像补充行为背景,而设备信号则提供IP地理位置和浏览器指纹等风险指标。示例 14-1展示了高层次的协调机制:从所有来源提取数据,在继续处理前验证数据质量,创建适当的时间分割以防止数据泄露,并处理欺诈数据固有的极端类不平衡问题。编号注释追踪了各阶段的流程, ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access