博客 · 2026年3月25日

欺诈预防：利用Shapley值进行模型解读 (ZH)

探索Shapley值如何在机器学习中革新欺诈检测。了解如何理解特征重要性，并构建更强大的欺诈预防系统。Shapley值源于博弈论，提供了一种公平且可解释的方法来评估各个特征对模型预测的贡献。.

作者：Didit2026年3月25日更新于 2026年5月22日

欺诈预防：利用Shapley值进行模型解读

在不断演变的在线欺诈环境中，传统的基于规则的系统往往难以抵御复杂的攻击。机器学习 (ML) 提供了一种强大的替代方案，但理解 ML 模型做出特定预测的原因至关重要——尤其是在金融交易和身份验证等高风险场景中。这时，Shapley 值就发挥作用了，它为欺诈预防提供了一种稳健且可解释的方法。它们提供了一种公平的方式，将预测的功劳分配给模型使用的各种特征。

关键要点 Shapley 值通过提供对模型预测的清晰、可解释的见解，在欺诈预防方面具有显著优势。

关键要点 它们有助于识别驱动欺诈检测的最有影响力的特征，从而提高模型准确性并减少误报。

关键要点 Shapley 值促进信任和透明度，对于监管合规性和用户接受度至关重要。

关键要点 这种方法对于复杂的机器学习模型（如梯度提升机和神经网络）特别有效，而这些模型通常是“黑盒”。

理解Shapley值

Shapley 值最初由博弈论提出，它确定了每个特征对模型预测的平均边际贡献。想象一下一个由玩家（特征）组成的团队，共同努力实现一个目标（欺诈检测）。Shapley 值计算每个玩家对整体成功的贡献，考虑到所有可能的团队组合。从数学上讲，特征 i 的 Shapley 值计算如下：

Φ_i = Σ_S⊆F{i} (|S|!(|F|-|S|-1)! / |F|!) * [f(S∪{i}) - f(S)]

其中：

Φ_i 是特征 i 的 Shapley 值
F 是所有特征的集合
S 是不包括 i 的特征子集
|S| 是子集 S 中的特征数量
f(S) 是仅使用子集 S 中的特征的模型预测

简单来说，它评估了将一个特征添加到所有其他特征的可能组合中的影响，然后对这些影响进行平均。这为每个特征的重要性提供了一个公平且一致的衡量标准。

将Shapley值应用于欺诈检测

在欺诈检测中，特征可能包括交易金额、IP 地址位置、设备信息、用户行为模式，以及来自 Didit 等服务的身份验证分数等。使用历史数据训练的机器学习模型可以预测欺诈概率。但是，仅仅知道一笔交易被标记为欺诈是不够的。我们需要理解原因。

Shapley 值提供了这个“原因”。例如，一个模型可能以 90% 的概率将一笔交易标记为欺诈。应用 Shapley 值显示，其中 60% 的概率归因于高风险 IP 地址，20% 归因于近期收货地址变更，10% 归因于低身份验证分数。这种粒度洞察非常宝贵。

这种洞察不仅仅是关于理解过去预测；它还在于改进未来的预测。通过识别最有影响力的特征，我们可以专注于改进这些特征的质量或开发新的特征，从而建立更准确和强大的欺诈检测系统。例如，如果低身份验证分数始终导致欺诈，我们可以投资于增强我们的身份验证流程。

在欺诈预防中使用Shapley值的益处

除了更强的可解释性之外，使用 Shapley 值还提供了几个关键好处：

提高模型准确性： 理解特征重要性可以实现有针对性的模型改进。
减少误报： 通过识别欺诈预测的原因，我们可以减少错误地将合法交易标记为欺诈的数量。
增强信任和透明度： 可解释的 AI 建立与利益相关者的信任，并促进监管合规性。向客户解释欺诈判定背后的原因比仅仅声明“您的交易已被阻止”更有效。
偏差检测： Shapley 值可以帮助发现模型中意想不到的偏差，确保公平和公正的结果。

实际考虑因素和实施

计算 Shapley 值可能计算成本很高，尤其是在具有大量特征的模型中。但是，已经开发了几种有效的算法，如 TreeSHAP，来解决这一挑战。这些算法利用决策树的结构来更快地逼近 Shapley 值。

流行的 Python 库，如 SHAP（SHapley Additive exPlanations），提供了这些算法的便捷实现。将 SHAP 集成到现有的机器学习流水线中相对简单。该过程通常包括训练模型，然后使用 SHAP 来解释训练模型的预测。

例如，考虑一个用户尝试在电子商务平台上创建帐户的场景。Didit 的身份验证流程贡献了一个分数，表明用户的合法性。使用 SHAP，我们可以量化该 Didit 分数对模型决定批准或拒绝帐户创建的贡献。低 Didit 分数，加上其他风险因素，可能是拒绝的主要驱动因素，从而提供明确的理由。

Didit 如何提供帮助

Didit 的强大身份验证平台为有效的欺诈预防系统提供了关键组件。通过将 Didit 的身份验证分数和风险信号集成到您的机器学习模型中，您可以获得一个显著提高准确性的强大功能。结合 Shapley 值，您可以了解 Didit 的数据如何贡献于欺诈检测，从而优化您的整体欺诈策略。

Didit 提供：

全面的身份验证： 验证身份文件、检测活体检测并执行生物特征认证。
实时风险评估： 根据各种信号评估用户风险，包括设备信息、IP 地址和行为生物特征。
无缝集成： 轻松将 Didit 的 API 集成到您现有的机器学习流水线中。

准备好开始了吗？

准备好释放 Shapley 值的力量并增强您的欺诈预防能力了吗？立即探索 Didit 的平台并请求演示。阅读我们的技术文档以了解有关我们的 API 和集成选项的更多信息。不要让欺诈破坏您的业务——通过数据驱动的洞察力来控制！