Passer au contenu principal
Didit lève 7,5 M$ pour bâtir l'infrastructure pour l'identité et la fraude
Didit
Retour au blog
Blog · 25 mars 2026

Prévention de la fraude : Exploiter les valeurs de Shapley (FR)

Découvrez comment les valeurs de Shapley, un concept de la théorie des jeux, révolutionnent la détection de la fraude avec l'apprentissage automatique.

Par DiditMis à jour le
fraud-prevention-shapley-values.png

Prévention de la fraude : Exploiter les valeurs de Shapley

Dans le paysage en constante évolution de la fraude en ligne, les systèmes traditionnels basés sur des règles sont souvent insuffisants face aux attaques sophistiquées. L'apprentissage automatique (ML) offre une alternative puissante, mais comprendre pourquoi un modèle ML fait une certaine prédiction est essentiel, en particulier dans des scénarios à enjeux élevés tels que les transactions financières et la vérification d'identité. C'est là que les valeurs de Shapley entrent en jeu, offrant une approche robuste et interprétable de la prévention de la fraude. Elles fournissent un moyen équitable de répartir le crédit d'une prédiction entre les différentes caractéristiques utilisées par le modèle.

Points clés Les valeurs de Shapley offrent un avantage significatif dans la prévention de la fraude en fournissant des informations claires et explicables sur les prédictions du modèle.

Points clés Elles aident à identifier les caractéristiques les plus influentes qui déterminent la détection de la fraude, améliorant ainsi la précision du modèle et réduisant les faux positifs.

Points clés Les valeurs de Shapley facilitent la confiance et la transparence, ce qui est particulièrement important pour la conformité réglementaire et l'acceptation par les utilisateurs.

Points clés Cette approche est particulièrement efficace pour les modèles d'apprentissage automatique complexes, tels que les machines à gradient boosting et les réseaux neuronaux, qui sont autrement des « boîtes noires ».

Comprendre les valeurs de Shapley

Initialement développées en théorie des jeux, les valeurs de Shapley déterminent la contribution marginale moyenne de chaque caractéristique à la prédiction du modèle. Imaginez une équipe de joueurs (caractéristiques) travaillant ensemble pour atteindre un objectif (détection de la fraude). La valeur de Shapley calcule la contribution de chaque joueur au succès global, en tenant compte de toutes les combinaisons d'équipes possibles. Mathématiquement, la valeur de Shapley pour la caractéristique i se calcule comme suit :

Φi = ΣS⊆F{i} (|S|!(|F|-|S|-1)! / |F|!) * [f(S∪{i}) - f(S)]

Où :

  • Φi est la valeur de Shapley pour la caractéristique i
  • F est l'ensemble de toutes les caractéristiques
  • S est un sous-ensemble de caractéristiques ne comprenant pas i
  • |S| est le nombre de caractéristiques dans le sous-ensemble S
  • f(S) est la prédiction du modèle utilisant uniquement les caractéristiques du sous-ensemble S

En termes plus simples, elle évalue l'impact de l'ajout d'une caractéristique à toutes les combinaisons possibles d'autres caractéristiques, puis calcule la moyenne de ces impacts. Cela fournit une mesure juste et cohérente de l'importance de chaque caractéristique.

Appliquer les valeurs de Shapley à la détection de la fraude

Dans la détection de la fraude, les caractéristiques peuvent inclure des éléments tels que le montant de la transaction, la localisation de l'adresse IP, les informations sur l'appareil, les schémas de comportement de l'utilisateur et, surtout, les scores de vérification d'identité provenant de services comme Didit. Un modèle d'apprentissage automatique entraîné sur des données historiques peut prédire la probabilité de fraude. Cependant, savoir qu'une transaction est signalée comme frauduleuse ne suffit pas. Nous devons comprendre pourquoi.

Les valeurs de Shapley fournissent ce « pourquoi ». Par exemple, un modèle peut signaler une transaction comme frauduleuse avec une probabilité de 90 %. L'application des valeurs de Shapley révèle que 60 % de cette probabilité sont attribués à une adresse IP à haut risque, 20 % à un changement récent d'adresse de livraison et 10 % à un faible score de vérification d'identité. Cette information granulaire est inestimable.

Cette information ne concerne pas seulement la compréhension des prédictions passées ; il s'agit d'améliorer les futures. En identifiant les caractéristiques les plus influentes, nous pouvons nous concentrer sur l'amélioration de la qualité de ces caractéristiques ou sur le développement de nouvelles, ce qui conduit à un système de détection de la fraude plus précis et plus robuste. Par exemple, si les faibles scores de vérification d'identité contribuent systématiquement à la fraude, nous pouvons investir dans l'amélioration de nos processus de vérification d'identité.

Avantages de l'utilisation des valeurs de Shapley dans la prévention de la fraude

Au-delà d'une plus grande interprétabilité, l'utilisation des valeurs de Shapley offre plusieurs avantages clés :

  • Amélioration de la précision du modèle : Comprendre l'importance des caractéristiques permet un affinement ciblé du modèle.
  • Réduction des faux positifs : En identifiant les raisons des prédictions de fraude, nous pouvons réduire le nombre de transactions légitimes incorrectement signalées comme frauduleuses.
  • Confiance et transparence accrues : L'IA explicable renforce la confiance des parties prenantes et facilite la conformité réglementaire. Expliquer le raisonnement derrière une détermination de fraude à un client est beaucoup plus efficace que de simplement indiquer « votre transaction a été bloquée ».
  • Détection des biais : Les valeurs de Shapley peuvent aider à découvrir des biais involontaires dans le modèle, garantissant des résultats équitables et impartiaux.

Considérations pratiques et implémentation

Le calcul des valeurs de Shapley peut être coûteux en termes de calcul, en particulier pour les modèles avec un grand nombre de caractéristiques. Cependant, plusieurs algorithmes efficaces, tels que TreeSHAP, ont été développés pour relever ce défi. Ces algorithmes tirent parti de la structure des arbres de décision pour approximer les valeurs de Shapley beaucoup plus rapidement.

Les bibliothèques Python populaires comme SHAP (SHapley Additive exPlanations) fournissent des implémentations pratiques de ces algorithmes. L'intégration de SHAP dans votre pipeline d'apprentissage automatique existant est relativement simple. Le processus implique généralement la formation de votre modèle, puis l'utilisation de SHAP pour expliquer les prédictions du modèle entraîné.

Par exemple, imaginez un scénario dans lequel un utilisateur tente de créer un compte sur une plateforme de commerce électronique. Le processus de vérification d'identité de Didit contribue un score indiquant la légitimité de l'utilisateur. En utilisant SHAP, nous pouvons quantifier la contribution de ce score Didit à la décision du modèle d'approuver ou de rejeter la création du compte. Un faible score Didit, associé à d'autres facteurs de risque, pourrait être le principal moteur d'un rejet, fournissant une justification claire.

Comment Didit aide

La plateforme de vérification d'identité robuste de Didit fournit un composant crucial pour les systèmes efficaces de prévention de la fraude. En intégrant les scores d'identité et les signaux de risque de Didit dans vos modèles d'apprentissage automatique, vous obtenez une caractéristique puissante qui améliore considérablement la précision. Combiné aux valeurs de Shapley, vous pouvez comprendre comment les données de Didit contribuent à la détection de la fraude, ce qui vous permet d'optimiser votre stratégie globale de prévention de la fraude.

Didit offre :

  • Vérification d'identité complète : Vérifiez les documents d'identité, détectez la présence d'une personne réelle et effectuez une authentification biométrique.
  • Évaluations des risques en temps réel : Évaluez le risque de l'utilisateur en fonction de divers signaux, notamment les informations sur l'appareil, l'adresse IP et la biométrie comportementale.
  • Intégration transparente : Intégrez l'API de Didit dans vos pipelines d'apprentissage automatique existants avec facilité.

Prêt à démarrer ?

Prêt à libérer la puissance des valeurs de Shapley et à améliorer vos capacités de prévention de la fraude ? Explorez la plateforme Didit dès aujourd'hui et demandez une démonstration. Lisez notre documentation technique pour en savoir plus sur nos API et nos options d'intégration. Ne laissez pas la fraude saper votre entreprise - prenez le contrôle grâce à des informations basées sur les données !

Infrastructure pour l'identité et la fraude.

Une seule API pour le KYC, le KYB, la surveillance des transactions et le screening de portefeuilles. Intégration en 5 minutes.

Demande à une IA de résumer cette page
Prévention de la fraude avec Shapley.