产品和工具: MongoDB Atlas、MongoDB Atlas Charts、MongoDB Data Federation
合作伙伴: Amazon S3, Amazon SageMaker Canvas
解决方案概述
金融机构面临着越来越大的网络犯罪风险,包括引人注目的黑客攻击和欺诈性交易。网络事件会破坏客户的信任,并可能给公司造成重大财务损失。由于传统欺诈系统的局限性,公司在实现安全系统方面举步维艰,这些局限性包括:
数据可见性不完整:无法访问权限用于模式检测的相关数据源。
欺诈系统内的延迟:缺乏实时处理能力,导致欺诈检测延迟。
安全协议薄弱:过时的安全措施使漏洞容易遭受网络攻击。
技术无序增长:各种技术使维护和更新复杂化。
团队协作不佳:导致响应延迟的孤立方法。
为了克服这些挑战,金融公司可以使用由...提供支持MongoDB Atlas和Amazon SageMaker Canvas 提供支持的实时分析解决方案。这些工具提供强大的欺诈检测系统,使用可用于其操作的最准确的数据。
在此系统中, MongoDB Atlas存储操作数据并处理大容量事务。同时, Amazon SageMaker Canvas 使用先进的AI和机器学习(ML) 工具来支持用于欺诈检测的高级分析。
参考架构
以下是用于构建此欺诈检测解决方案的架构。该架构包括用于检测银行业不同类型欺诈的端到端解决方案,包括卡欺诈检测、身份盗窃检测和消费者欺诈检测。
该架构图说明了模型培训和近乎实时的推理。使用MongoDB Atlas Triggers 将存储在 MongoDB MongoDB Atlas中的操作数据写入Amazon S3 存储桶。数据以这种方式存储,用于在Amazon SageMaker Canvas 中创建和训练模型。SageMaker Canvas 将模型的元数据存储在 S3 存储桶中,并公开模型端点以进行推理。

图 1. 欺诈检测架构
数据模型方法
数据分为两个单独的文件:
事务
身份
这些文件通过 TransactionID
连接。然而,并非每笔ACID 事务都包含相关的身份详细信息。
根据上述两个数据集,在 TransactionID
上准备一个测试联接,将目标列添加为“Fraud”(欺诈)。
数据来源于 Kaggle。
Source Table1: Transaction TransactionID, TransactionDT, Card_no, Card_type, Email_domain, ProductCD, TransactionAmt, Transaction_ID Source Table2: Identity TransactionID, IpAddress, PhoneNo, DeviceID, Location, Name, Address Test Data: TransactionID, Card_no, card_type, Email_domain, IpAddress, PhoneNo, DeviceID, ProductCD, TransactionAmt, isFraud
构建解决方案
有关构建此解决方案的详细分步指南,请参阅此Github存储库 。以下是所采取步骤的概述:
设置需要将MongoDB Atlas数据导出到的 S3 存储桶。
设置MongoDB Atlas集群。
设置 Amazon SageMaker 域。
关键要点
开发实时欺诈检测解决方案: MongoDB Atlas以灵活的模式处理大量数据,使金融机构能够实时捕获、存储和进程大量事务数据。
更新欺诈检测模型:使用 MongoDB 的聚合管道进行实时处理,确保使用可用的最新相关信息持续训练模型。这种容量为金融机构提供了创建强大的欺诈检测系统的强大工具。
集成先进的AI和 ML 工具: MongoDB与Amazon SageMaker 等外部服务集成,后者在无代码平台中提供AI和 ML 解决方案。这种友好的用户界面使分析师可以访问模型,使他们能够轻松生成准确的机器学习预测,用于分类、回归、预测、自然语言处理(NLP) 和计算机视觉 (CV)。
作者
Babu Srinivasan,MongoDB 合作解决方案架构师
Igor Alekseev,AWS 合作解决方案架构师