如何识别电商欺诈?
30分钟的商业对策 | Links:
问题
- 如何通过用户在电商上的第一次购买行为,判断是否存在欺诈行为,例如信用卡盗刷、洗钱等。
识别欺诈行为的基本逻辑
- 建立机器学习分类模型预测欺诈行为的概率
- 重点特征工程
- ip地址对应的国家
- 购买行为与账户注册的时间间隔
- 重复IP地址
- 重复设备
选择合适的threshold
- 要预先考虑false positive与false negative的代价
- 在电商案例中,较高false positive意味着将更多无辜的人判断为了欺诈,进而提高了验证门槛,有可能导致用户流失。
- 而较高的false negative意味着无法预先识别欺诈行为,可能直接导致金钱损失。
- 为了同时最大化sensitivy和specifity, 在这个案例中选择最大化 tpr - fpr,由此可以计算得出优化的threshold。
如何将机器学习模型应用于产品
- 此类模型的常用用途是辅助进行风险管理
- 根据对每个用户的欺诈行为预测概率,我们可以把风险分为多个层次,从而采取不同的措施
- 高风险:冻结操作,人工审核,进而阻止该用户的进入
- 中风险:需要额外验证(电话号码验证,其它账户验证)
- 低风险:畅通无阻
- 选取风险阈值的方法
- 可通过预测概率均值来创造二分层次
- 均值 +/-标准差来生成三分层次
- 利用quantile生成多个层次