分享嘉宾:
张晓明 星环科技金融架构总监
分享内容:
想要更好地做反欺诈?基于人工智能和复杂网络的实时解决方案来一套。
当前金融业的欺诈风险正在发生变化,欺诈风险的表现形式也越来越复杂多样,套现、伪卡、薅羊毛等层出不穷。
为了更好地识别、量化、预测和防范欺诈风险,星环科技结合自己的产品技术优势和在金融业多年的落地经验积累,推出了一款全栈式的智能反欺诈系统解决方案——“基于人工智能和复杂网络的实时反欺诈风控平台”。
本方案经过多家银行、消费金融和保险机构的落地后,形成了事中可实时、量化可解释、智能可预测、图谱可洞察四大特色。
7月3日15点,不见不散!
更多新产品及解决方案深度解析敬请期待!
往期回看方式:
关注“星环社区”公众号,点击菜单栏“直播回看——深度解读回看”即可无广告回看以往所有分享
交易次数 单笔或累计 同人交易 改信息后 首次非同名转账、
多次注册账号
异常 金额超常 笔数异常 大额转账 限额取现
交易时间 交易金额 同卡同商户笔 连续网银 转账笔数、 注册失败
异常 大于平均值 数异常 限额转让 金额超常 次数较多
非营业时间 连续输错 连续网银 相同IP
大额交易 卡密码 限额转账 多次注册
单笔或累计金 非习惯位置、
额异常 时间交易
业务 1. 业务系统通过 Kafka供数
Kafka 服务 型 三、风险处置与管理
系统 2. 特征化,补齐衍生特征
3. Slipstream流式计算 1. 管理员按照流程定义处理
4. 决策引擎规则利用 2. 风险标记后记录数据库
• 画像、外部黑名单等 3. 展现平台产生大屏和报表
• 关联分析、预测结果
历史 流引擎
TDT/Sqoop 特征化 风险管理 报警
数据 Slipstream 规则+预测+
一、离线机器学习
1. 数据接入工具获取数据 交易 画像
2. 特征化,补齐衍生特征 数据 系统
3. 数据存储到数据仓库中 报表
4. 画像系统对个人行为画像 离线分析
5. 利用Sophon进行离线分析
6. 根据分析的结果包括 风险
• 异常数据的特征 基线+异常 大屏
• 规则参数的建议值 +聚类+决
• 用于预测的模型
异常识别 树推理规则 业务标记 关系 团伙
异常频繁规则 分类预测 规则触发
异常 发现
规则推理 梯度提升树模型 频繁模式挖掘 输出异常评分
RF、GBDT、
知识图谱及推理 专家规则提取组合
Xgboost
异常检测算法(LOF + Isolation Forest)
特征工程 特征工程(横向变换,纵向压塑,横向组合) 各类关系图谱整合 专家规则指标梳理
数据清洗、统计、整合
静态数据 关注名单&公共信用数据
性别、年龄 高、中、低风险关注名单
籍贯、户口 法院名单数据
资产情况 欠税数据
设备指纹 公安犯罪通缉名单
交易数据 行为数据
交易笔数 APP登录行为
交易金额 APP操作行为
2020/7/6 © 2019 Transwarp. All rights reserved. Transwarp Confidential. 星 环 科
12 .风控多维度数据
风险号码识别 征信&信贷数据
虚假号码 人行征信数据
通信小号 网贷平台信息查询
中介号码 互金协会信息查询
IP地址画像 多头申请
VPN识别
IP地址类型
地址真实性
电商快递地址
位置解析服务 大数据整合 家庭住址
手机号归属地 单位地址
IP归属地
身份证归属地
数据采集服务
智能定位 运营商信息
GPS位置信息 黑名单服务 社交信息
基站定位 网购交易数据
支付黑名单
经纬度解析地址 社保公积金数据
欺诈黑名单
公检法失信人
{ }
交易 交易 团伙
交易 X 静态 X 窗口 X X
链路 网络 挖掘
• 多维度、多粒度特征 • 黑灰团伙发现能力,高可泛化性
• 高拓展性 • 不易被探知、攻击
• 快速发现和处置 • 高可解释性,易于新模式发现
14 . 2.2
chapter
平台解决方案核心——
15 .人工智能产品Transwarp Sophon
应用场景和模板 Usage Scenarios, Templates and Example Models
Semantic
Profiling
测 时 实 异 精 用 流 智 以 目 视 图 文 智 主 语 情
Analysis
护 析 控 别 销 像 警 控 图 踪 别 类 别 答 析 索 析
Sophon Web – 交互式建模工具 Interactive Modeling Environment
数据探索 数据预处理 特征工程 智能建模 模型训练 模型部署
Data Exploration Data Preprocessing Feature Engineering Auto Modeling Model Training Model Publish/Manage
Sophon Modules – 功能子模块 Functionality Modules as Plugins
Sophon CV Sophon DL Sophon ST Sophon TM Sophon GA Sophon KG Sophon IoT Sophon VI
视频图像模块 深度学习模块 智能标签模块 智能营销模块 图分析模块 知识图谱模块 物联网模块 可视化模块
Computer Vision Deep Learning Smart Tagging Target Marketing Graph Analysis Knowledge Graph IoT Suite Visualization
Sophon Base - 核心基础模块 Core Methodology, Frameworks & Algorithm Libraries
统计算法库 机器学习算法库 深度学习算法库
Statistics Algorithms Library Machine Learning Algorithms Library Deep Learning Algorithms Library
远程SQL访问接口 分布式计算引擎 深度学习计算框架 图分析接口
SQL Access Distributed Computation Engine Deep Learning Framework Graph Analytics API
Transwarp Operating System (Embedded Edition) – Container Execution and Management Framework
16 .建模流程图形化拖拽
17 .分布式并行计算框架——集合百余种金融数据处理算子
HDFS(ORC、Parquet等数据格式)、HBase、ES、本地文件(csv、json等数 基础能力:支持多种优化算法包括Parallel SGD以及FTRL。算法参数可配置。
据格式)、MySQL、DB2、Oracle等。 特征权重:WOE、GINI、INFO、PCA等。
一元变量特征统计(均值、方差、类型数等)、二元变量特征统计(皮尔森
数据探索 预处理:PCA、SVD、DCT离散余弦变换、乔列斯基矩阵分解、LOF异常点检测
卡方、自由度等)
数据清洗:缺失值填充(平均值、最大值、最小值、中位数等)
分类算法:逻辑回归、支持向量机SVM、朴素贝叶斯、决策树分类、随机森林
数据集成:支持包括数据库,文本,大数据平台在内各个数据源的数据集成, 分类、梯度提升树分类、KNN分类、多层感知机分类、Boost分类、基于
通过数据实体、属性对齐等方式构造统一的数据视图。 XGBoost的分类
数据变换:数据属性转换、新属性生成。 回归算法:线性回归、广义线性回归、决策树回归、随机森林回归、梯度提升
数据规约:数据属性的归一化工具(min-max归一化、标准归一化、max- 树回归、基于XGBoost的回归、保序回归、生存回归
abs归一化等 聚类算法:支持Kmeans,Dbscan,二分Kmeans、GMM等
自动化预处:自动填充数据、自动清理数据、自动数据转换以及自动数据归 关联规则:支持FP-Growth、PrefixSpan和Aprioi等
推荐算法:支持ALS、FM因子分解机、ItemCF、UserCF等
基本特征转化:特征变换、特征重要性评估、特征选择、特征生成等,包括
时序分析:支持自回归AR、差分自回归移动平均过程ARIMA等
特征工程 且不限于归一化、标准化、离散化、one-hot编码等 深度学习:支持GPU可配置,包含多种神经层:Dense层、池化层、输入层、
自动化特征工程:自动特征变换、自动特征生成以及自动特征选择等。
输出层、卷积层、RNN层、LSTM层等
数据分割:按比例随机分配训练与测试集,交叉检验 自然语言处理:支持新词发现、分词、词频TF、逆文档词频IDF、命名实体识别、
分类评估:对于二分类,输出包括TP/TN/FP/FN的数目表格。对于多分类, Word2Vec、词库构建、LDA、词性标注、关键词抽取、自动摘要、情感分析、
模型评估 输出混淆矩阵 句子相似度、文档相似度、PSLA等
评估指标:KS、Lift、AUC、ROC、Precision、Weighted Recall、Recall、 图像处理:支持图片读取、图像展示、图像训练和图片存储等
FMeasure
强化学习:支持值迭代、策略迭代、DQN、Q-Learning、蒙特卡洛算法、
模型导入导出:支持4种以上模型的object以及PMML/JSON格式导出,导出
模型管理 SARSA、DDPG、A3C、A2C、PPO等
位置位于数据库、HDFS等
18 . 2.3
chapter
平台解决方案落地——
决策引擎FIDE
19 .实时智能决策流程
离线训练 在线预测
离线数据 (正样本&负样本) 实时数据
Transwarp FIDE (决策)
触发决策事件
指标平台 决策引擎
Transwarp Sophon(AI) PMML模型导入
机器学习 深度学习
WebAPI进行模型调用
数据挖掘平台
在线预测结果
分类 聚类 回归
业务指标定义&计算 统一智能决策
业务输入 业务应用
借助大数据技术实现 指标调用 依托数据,借助决策引擎 风险识别
实时指标计算能力 实现规则+模型自动化流程决策 辅助决策
专家经验 业务策略
借助规则策略的积累完成业务中专家经验的沉淀
业务反馈,丰富业务规则