Prevenção de Fraudes: Aproveitando os Valores de Shapley (PT-BR)
Descubra como os Valores de Shapley, um conceito da teoria dos jogos, estão revolucionando a detecção de fraudes com machine learning. Aprenda a entender a importância dos recursos e construir sistemas de prevenção de fraudes.

Prevenção de Fraudes: Aproveitando os Valores de Shapley
No cenário em constante evolução da fraude online, os sistemas tradicionais baseados em regras frequentemente não conseguem lidar com ataques sofisticados. O aprendizado de máquina (ML) oferece uma alternativa poderosa, mas entender o porquê de um modelo de ML fazer uma determinada previsão é fundamental – especialmente em cenários de alto risco, como transações financeiras e verificação de identidade. É aí que entram os Valores de Shapley, oferecendo uma abordagem robusta e interpretável para a prevenção de fraudes. Eles fornecem uma maneira justa de distribuir o crédito por uma previsão entre os vários recursos usados pelo modelo.
Principais conclusões Os Valores de Shapley oferecem uma vantagem significativa na prevenção de fraudes, fornecendo insights claros e explicáveis sobre as previsões do modelo.
Principais conclusões Eles ajudam a identificar os recursos mais influentes que impulsionam a detecção de fraudes, melhorando a precisão do modelo e reduzindo os falsos positivos.
Principais conclusões Os Valores de Shapley facilitam a confiança e a transparência, o que é particularmente importante para a conformidade regulatória e a aceitação do usuário.
Principais conclusões Essa abordagem é particularmente eficaz para modelos complexos de aprendizado de máquina, como máquinas de boosting de gradiente e redes neurais, que, de outra forma, são 'caixas pretas'.
Entendendo os Valores de Shapley
Originalmente desenvolvido na teoria dos jogos, os Valores de Shapley determinam a contribuição marginal média de cada recurso para a previsão do modelo. Imagine uma equipe de jogadores (recursos) trabalhando juntos para atingir um objetivo (detecção de fraudes). O Valor de Shapley calcula quanto cada jogador contribuiu para o sucesso geral, considerando todas as combinações possíveis de equipe. Matematicamente, o Valor de Shapley para o recurso i é calculado como:
Φi = ΣS⊆F{i} (|S|!(|F|-|S|-1)! / |F|!) * [f(S∪{i}) - f(S)]
Onde:
- Φi é o Valor de Shapley para o recurso i
- F é o conjunto de todos os recursos
- S é um subconjunto de recursos que não inclui i
- |S| é o número de recursos no subconjunto S
- f(S) é a previsão do modelo usando apenas os recursos no subconjunto S
Em termos mais simples, ele avalia o impacto de adicionar um recurso a todas as combinações possíveis de outros recursos e, em seguida, calcula a média desses impactos. Isso fornece uma medida justa e consistente da importância de cada recurso.
Aplicando os Valores de Shapley à Detecção de Fraudes
Na detecção de fraudes, os recursos podem incluir coisas como o valor da transação, a localização do endereço IP, informações do dispositivo, padrões de comportamento do usuário e, crucialmente, pontuações de verificação de identidade de serviços como o Didit. Um modelo de aprendizado de máquina treinado em dados históricos pode prever a probabilidade de fraude. No entanto, saber que uma transação foi sinalizada como fraudulenta não é suficiente. Precisamos entender o porquê.
Os Valores de Shapley fornecem esse “porquê”. Por exemplo, um modelo pode sinalizar uma transação como fraudulenta com uma probabilidade de 90%. A aplicação dos Valores de Shapley revela que 60% dessa probabilidade é atribuída a um endereço IP de alto risco, 20% a uma mudança recente no endereço de entrega e 10% a uma pontuação de verificação de identidade baixa. Esse insight granular é inestimável.
Esse insight não se trata apenas de entender previsões passadas; trata-se de melhorar as futuras. Ao identificar os recursos mais influentes, podemos nos concentrar em melhorar a qualidade desses recursos ou desenvolver novos, levando a um sistema de detecção de fraudes mais preciso e robusto. Por exemplo, se as pontuações de verificação de identidade baixas contribuem consistentemente para fraudes, podemos investir no aprimoramento de nossos processos de verificação de identidade.
Benefícios de Usar os Valores de Shapley na Prevenção de Fraudes
Além de uma maior interpretabilidade, o uso dos Valores de Shapley oferece vários benefícios importantes:
- Precisão aprimorada do modelo: Compreender a importância dos recursos permite o refinamento direcionado do modelo.
- Redução de falsos positivos: Ao identificar os motivos por trás das previsões de fraude, podemos reduzir o número de transações legítimas sinalizadas incorretamente como fraudulentas.
- Confiança e transparência aprimoradas: A IA explicável gera confiança com as partes interessadas e facilita a conformidade regulatória. Explicar o raciocínio por trás de uma determinação de fraude a um cliente é muito mais eficaz do que simplesmente declarar “sua transação foi bloqueada”.
- Detecção de viés: Os Valores de Shapley podem ajudar a descobrir vieses não intencionais no modelo, garantindo resultados justos e equitativos.
Considerações práticas e implementação
Calcular os Valores de Shapley pode ser computacionalmente caro, especialmente para modelos com um grande número de recursos. No entanto, vários algoritmos eficientes, como o TreeSHAP, foram desenvolvidos para resolver esse desafio. Esses algoritmos aproveitam a estrutura das árvores de decisão para aproximar os Valores de Shapley muito mais rapidamente.
Bibliotecas populares em Python, como SHAP (SHapley Additive exPlanations), fornecem implementações convenientes desses algoritmos. Integrar o SHAP ao seu pipeline de aprendizado de máquina existente é relativamente simples. O processo normalmente envolve o treinamento do modelo e, em seguida, o uso do SHAP para explicar as previsões do modelo treinado.
Por exemplo, considere um cenário em que um usuário tenta criar uma conta em uma plataforma de comércio eletrônico. O processo de verificação de identidade do Didit contribui com uma pontuação indicando a legitimidade do usuário. Usando o SHAP, podemos quantificar quanto essa pontuação do Didit contribuiu para a decisão do modelo de aprovar ou rejeitar a criação da conta. Uma pontuação baixa do Didit, juntamente com outros fatores de risco, pode ser o principal fator de uma rejeição, fornecendo uma justificativa clara.
Como o Didit ajuda
A robusta plataforma de verificação de identidade do Didit fornece um componente crucial para sistemas eficazes de prevenção de fraudes. Ao integrar as pontuações de identidade e os sinais de risco do Didit em seus modelos de aprendizado de máquina, você obtém um recurso poderoso que melhora significativamente a precisão. Combinado com os Valores de Shapley, você pode entender como os dados do Didit contribuem para a detecção de fraudes, permitindo que você otimize sua estratégia geral de fraude.
O Didit oferece:
- Verificação abrangente de identidade: Verifique documentos de identidade, detecte vivacidade e execute autenticação biométrica.
- Avaliações de risco em tempo real: Avalie o risco do usuário com base em uma variedade de sinais, incluindo informações do dispositivo, endereço IP e biometria comportamental.
- Integração perfeita: Integre a API do Didit em seus pipelines de aprendizado de máquina existentes com facilidade.
Pronto para começar?
Pronto para liberar o poder dos Valores de Shapley e aprimorar suas capacidades de prevenção de fraudes? Explore a plataforma Didit hoje e solicite uma demonstração. Leia nossa documentação técnica para saber mais sobre nossas APIs e opções de integração. Não deixe que a fraude prejudique seus negócios – assuma o controle com insights orientados por dados!