Blog · 16 de abril de 2026

KYC na Era dos LLMs: Por Que Laboratórios de IA de Ponta Precisam de Verificação de Identidade Para Sobreviver (PT-BR)

Modelos de fronteira custam centenas de milhões para treinar e podem ser destilados por centavos. A verificação de identidade no acesso à API está se tornando obrigatória.

Por Didit16 de abril de 2026Atualizado 22 de mai. de 2026

Em fevereiro de 2026, a Anthropic publicou evidências de que três laboratórios de IA chineses haviam coletivamente realizado 16 milhões de interações com o Claude usando 24.000 contas fraudulentas. O objetivo não era experimentação casual. Era destilação em escala industrial: treinar modelos mais baratos e mais fracos com base nos resultados do sistema de IA mais caro já construído.

Dois meses depois, a Anthropic implementou a verificação de identidade por passaporte e selfie no Claude.

Essa sequência não é coincidência. É a história de conformidade definidora da era dos LLMs. A IA de fronteira está sendo arrastada, de forma rápida e inevitável, para a mesma disciplina de "conheça seu cliente, monitore seu cliente" sob a qual bancos, corretoras e exchanges de criptomoedas operam. Este artigo explica por quê, como isso se traduz na prática e o que todas as empresas de IA — não apenas os laboratórios de ponta — devem fazer a respeito.

A Economia Que Torna o KYC Inevitável

Treinar um modelo de fronteira hoje custa entre 100 milhões e 1 bilhão de dólares apenas em poder computacional. GPT-4, Claude 3.5 Opus, Gemini Ultra, Grok 3 — todos se encaixam nessa faixa. A próxima geração ultrapassará a marca de 1 a 10 bilhões de dólares.

A destilação custa aproximadamente 0,1% disso. Forneça a um modelo mais fraco alguns milhões de exemplos de alta qualidade de um modelo mais forte, ajuste-o por algumas semanas e você terá recuperado uma grande fração da capacidade do modelo-alvo na maioria dos benchmarks.

A diferença entre "treinar um modelo de fronteira" e "destilar um modelo de fronteira" é de três ordens de magnitude. Essa assimetria é o fato econômico mais importante em IA atualmente. Ela explica por que todos os principais laboratórios de fronteira já estão executando um programa de KYC ou têm um em desenvolvimento ativo.

Sem KYC, o ataque é trivial:

Registre o máximo de contas de API que puder automatizar
Roteie o tráfego por proxies residenciais para contornar os limites de taxa de IP
Use e-mails falsificados, números de telefone alugados e cartões pré-pagos
Obtenha alguns milhões de rastreamentos de raciocínio em tarefas de codificação, matemática, uso de ferramentas e agentes
Treine seu próprio modelo com o conjunto de dados
Lance-o gratuitamente ou a uma fração do preço original

A conta total para o atacante é de dezenas de milhares de dólares em gastos com API. O dano comercial para o laboratório cujo modelo foi destilado é na casa dos bilhões. Este não é um sistema estável.

Como a Destilação Realmente Se Parece

O artigo técnico da Anthropic descreveu os padrões de ataque com clareza incomum. As assinaturas que eles detectaram incluem:

Modelos de prompt repetitivos em centenas de contas coordenadas, projetados para provocar cadeias de raciocínio consistentes
Padrões de elicitação de cadeia de pensamento — prompts que forçam o modelo a expor seu raciocínio completo, que é então coletado como dados de treinamento
Tráfego direcionado à capacidade — frotas inteiras de contas focadas exclusivamente em codificação, uso de ferramentas de agente ou raciocínio matemático, dependendo da capacidade-alvo
Arquiteturas de cluster "Hydra" — redes de contas distribuídas em APIs e provedores de nuvem para ficar abaixo dos limites de anomalia por ponto de extremidade
Serviços de proxy comerciais gerenciando dezenas de milhares de contas simultaneamente, misturando tráfego de destilação com cargas de trabalho legítimas para envenenar o sinal

Os atores nomeados — DeepSeek, Moonshot AI, MiniMax — foram responsáveis por operações específicas:

MiniMax: 13 milhões de interações, focadas em codificação de agentes e orquestração de ferramentas
Moonshot AI: 3,4 milhões de interações, abrangendo raciocínio de agentes, codificação e visão computacional
DeepSeek: 150.000 interações, extraindo capacidades de raciocínio

Todos os laboratórios de fronteira presumem que o mesmo ataque está sendo executado contra eles. A maioria ainda não está divulgando os números.

Por Que KYC Especificamente

Existem muitas defesas possíveis contra a destilação. KYC não é o único, e por si só não é suficiente. No entanto, é a camada fundamental que faz com que todas as outras defesas funcionem.

Detecção Sem Identidade É Um Peneira Vazada

Você pode construir excelentes classificadores comportamentais que detectem padrões de destilação. Anthropic fez isso. Mas se o atacante puder criar 1.000 novas contas em uma hora, o valor do seu classificador diminui rapidamente. Cada conta banida é substituída antes que você termine de escrever a justificativa para o banimento.

Com identidade verificada, cada conta banida impõe um custo real ao atacante — eles precisam de uma nova identidade, um novo documento, uma nova biometria. Em algum ponto de preço, o ataque deixa de ser lucrativo.

Recurso Legal Requer Um Réu Real

A Anthropic pode processar a DeepSeek. Ela não pode processar "conta-98234@tempmail.com". Violações dos termos de serviço só são executáveis se você souber quem os violou. KYC transforma os termos de serviço de um documento simbólico em um contrato acionável.

Controles de Segurança Entram em Colapso Sem Identidade

Todo o catálogo de implantações com controle de capacidade — limiares de elevação de biosegurança, fluxos de trabalho de controle de exportação, bloqueio de entidades sancionadas, proteção de menores — depende de saber, no mínimo, a jurisdição, idade e status legal do usuário. Você não pode filtrar quem você não identifica.

Reguladores Estão Chegando

A Lei de IA da UE está em vigor. O Instituto de Segurança de IA do Reino Unido tem acordos de teste diretos com laboratórios de fronteira. A ordem executiva dos EUA sobre IA define limites de relatórios. A Administração do Ciberespaço da China já exige verificação de identidade em IA generativa. KYC no acesso à IA está passando de uma prática recomendada para uma expectativa regulatória em todas as principais jurisdições.

O Playbook Emergente Para KYC de LLM

A forma do KYC para plataformas de IA está convergindo rapidamente. Com base no que Anthropic, OpenAI, Google DeepMind e os maiores provedores de nuvem de IA corporativa estão fazendo agora, o programa padrão parece assim.

Nível 1: Acesso Público

Nível gratuito, produtos de chat de consumidor. Verificação de e-mail, verificação de telefone, impressão digital do dispositivo, CAPTCHAs. Sem verificação de documentos, a menos que os sinais de risco a acionem. O objetivo é filtrar abusos óbvios sem destruir o funil de inscrição.

Nível 2: Acesso à API

Clientes de API pagos. Verificação do método de pagamento como identidade proxy (KYC de nível Stripe), mais alguma combinação de:

Verificação de telefone no registro
Geolocalização de IP e triagem de jurisdição
Verificação do domínio de e-mail da organização para empresas
Verificação de ID acionada por limites de volume, nível de capacidade ou sinais de anomalia

É onde o lançamento atual do Claude da Anthropic se encaixa.

Nível 3: Due Diligence Aprimorada

Contratos empresariais, compromissos de inferência em massa, acesso a capacidades de fronteira (raciocínio de longo contexto, uso de ferramentas de agente, codificação em escala). A pilha KYC completa:

Verificação de documento de identidade emitido pelo governo com detecção de vivacidade
Selfie biométrica correspondendo à foto do documento de identidade
Triagem de sanções, PEP e mídia adversa
Beneficiários finais para clientes corporativos
Origem dos fundos para compromissos muito grandes
Declaração de uso pretendido com restrições contratuais

Nível 4: Capacidades de Alto Risco

Qualquer coisa que cruze a Política de Escala Responsável do laboratório ou limite equivalente — modelos de elevação de biologia, agentes autônomos com acesso de gravação no mundo real, recursos cibernéticos de uso duplo. Integração personalizada com revisão manual, verificação do cliente governamental, conformidade com o controle de exportação, reverificação periódica.

A maioria dos usuários finais só verá o Nível 1. Os desenvolvedores viverão no Nível 2. Os clientes empresariais experimentarão o Nível 3. O Nível 4 é reservado para um pequeno número de entidades aprovadas sob supervisão direta do governo.

O Que Os Laboratórios de Fronteira Estão Fazendo Errado

Os primeiros lançamentos estão aprendendo na prática, e os erros são instrutivos.

Lançamentos Silenciosos Destroem a Confiança

A Anthropic lançou a verificação de identidade no Claude com um único artigo central de ajuda. Sem postagem de blog. Sem aviso prévio. Sem escopo publicado. A reação resultante foi previsível e amplamente evitável. Os usuários aceitam o KYC quando a justificativa é clara e o tratamento de dados é explícito. Eles se rebelam quando a verificação aparece da noite para o dia sem explicação.

Gatilhos Não Claros Criam Paranóia

"Alguns usuários, para alguns recursos" é uma estratégia de lançamento razoável, mas uma estratégia de comunicação terrível. Os usuários presumem o pior — que o gatilho é político, ideológico ou arbitrário. Publique os gatilhos. "Verificamos quando você excede X solicitações/dia, quando você acessa o recurso Y ou quando nossos sinais de fraude sinalizam o padrão Z" é uma mensagem muito melhor do que lançamentos opacos.

Manter Dados Biométricos Internamente É Um Erro

Todos os laboratórios de fronteira que construíram sua própria pilha de verificação de identidade se arrependerão disso em dois anos. A custódia biométrica é um negócio especializado, regulamentado e auditado. Faça parceria com um provedor dedicado (Persona, Onfido, Didit) e saia do negócio de custódia de dados. A Anthropic acertou nesse ponto.

Ignorar a Experiência do Desenvolvedor

Se o KYC bloquear seu cliente de API por dois dias enquanto um revisor analisa uma digitalização de documento confusa, você perdeu esse cliente. Os melhores fluxos de verificação são concluídos em menos de 90 segundos em um dispositivo móvel com verificações de vivacidade em tempo real e análise automatizada de documentos. Qualquer coisa mais lenta é uma desvantagem competitiva.

O Que Todo Produto de IA Deve Fazer, Não Apenas Os Laboratórios de Fronteira

Se você está construindo sobre uma API LLM — um chatbot, uma plataforma de agente, uma ferramenta de codificação, um produto de conteúdo — você não está isento dessa mudança. Você está a jusante dela.

Três recomendações práticas:

1. Assuma Que Seu Provedor Upstream Exigirá Mais Verificação

A Anthropic pedirá mais de seus clientes de API com o tempo. Da mesma forma, a OpenAI. Se sua empresa não puder passar por due diligence aprimorada (beneficiário final verificado, declarações de uso pretendido, triagem de controle de exportação), seu acesso à API estará em risco. Organize sua postura KYC corporativa agora, antes que se torne uma emergência.

2. Implemente KYC Baseado em Risco Em Seus Próprios Usuários

Seu produto provavelmente está sendo abusado nas mesmas taxas que os laboratórios de fronteira. Agentes de spam, redes de raspagem, bots de falsificação, esquemas de fraude. A arquitetura correta:

Baixo atrito no registro — e-mail, telefone, impressão digital do dispositivo
Verificação acionada por sinais de risco — volume, anomalia, padrões suspeitos, recursos confidenciais
Verificação aprimorada para níveis pagos — documento + vivacidade + triagem de sanções
Monitoramento contínuo — impressões digitais comportamentais, reverificação em anomalias

Este é o mesmo modelo baseado em risco que os bancos usam há décadas, adaptado para produtos de IA.

3. Escolha Um Provedor de Identidade Que Se Adapte aos Fluxos de Trabalho de IA

Os fornecedores de KYC legados foram construídos para bancos. Eles são lentos, caros e otimizados para a métrica errada. Produtos de IA precisam de:

Verificação rápida — menos de 90 segundos de ponta a ponta
Preços baseados no uso — sem mínimos, sem contratos corporativos para experimentação
Ampla cobertura de documentos — 14.000+ tipos de documentos em 220+ países (produtos de IA são globais desde o primeiro dia)
Detecção de vivacidade real — porque a fraude impulsionada por deepfake já é a norma em 2026
API limpa — porque as empresas de IA enviam semanalmente, não trimestralmente

Esta é a lacuna que a Didit foi construída para: infraestrutura de identidade central para IA a US$ 0,30 por verificação, sem contratos, sem mínimos, 500 verificações gratuitas por mês. É a forma de verificação de identidade que corresponde à forma como as empresas de IA realmente constroem e dimensionam.

O Jogo Final

Cinco anos a partir de agora, registrar-se em uma conta de API com um laboratório de IA de fronteira parecerá abrir uma conta de corretagem. Identidade verificada. Verificação da origem dos fundos para grandes compromissos. Monitoramento contínuo. Relatórios de atividades suspeitas. Reverificação periódica.

Isso pode parecer distópico para algumas pessoas. No entanto, é o resultado lógico de duas forças: o custo assombroso do treinamento de fronteira e a capacidade assombrosa do que está sendo treinado. Quando a coisa do outro lado da API puder aprimorar significativamente um programa de armas biológicas ou ser destilada em um produto que destrói bilhões em valor empresarial, a camada de acesso tem que se parecer com uma infraestrutura financeira regulamentada.

Os laboratórios que descobrirem como fazer isso sem quebrar a experiência do desenvolvedor vencerão. Aqueles que se recusarem a verificar (e se tornarem irrelevantes destilados) ou verificarem mal (e perderem desenvolvedores para concorrentes) não o farão.

KYC não é o inimigo da inovação em IA. A destilação descontrolada é. Quanto mais cedo a indústria internalizar isso, melhor será o equilíbrio para todos — laboratórios, desenvolvedores, clientes empresariais e os usuários que dependem da camada de IA para continuar existindo.

---

A Didit fornece infraestrutura de verificação de identidade construída para produtos de IA nativos. Verificação de documentos, vivacidade biométrica, triagem AML, monitoramento contínuo — a US$ 0,30 por verificação, em mais de 220 países. Comece grátis.