Blog · 16 de abril de 2026

KYC na Era dos LLMs: Porque os Laboratórios de IA de Ponta Precisam de Verificação de Identidade para Sobreviver (PT-PT)

Modelos de ponta custam centenas de milhões para treinar e podem ser destilados por cêntimos. A verificação de identidade no acesso à API está a tornar-se obrigatória.

Por Didit16 de abril de 2026Atualizado 22/05/2026

Em fevereiro de 2026, a Anthropic publicou provas de que três laboratórios de IA chineses tinham coletivamente realizado 16 milhões de interações com o Claude utilizando 24.000 contas fraudulentas. O objetivo não era a experimentação casual. Era a destilação em escala industrial: treinar modelos mais baratos e mais fracos com base nos resultados do sistema de IA mais caro já construído.

Dois meses depois, a Anthropic implementou a verificação de identidade com passaporte e selfie no Claude.

Essa sequência não é coincidência. É a história de conformidade definidora da era dos LLMs. A IA de ponta está a ser arrastada, rápida e inevitavelmente, para a mesma disciplina de "conheça o seu cliente, monitore o seu cliente" sob a qual bancos, corretores e bolsas de criptomoedas operam. Este artigo explica porquê, como se manifesta na prática e o que todas as empresas de IA — não apenas os laboratórios de ponta — devem estar a fazer a respeito disso.

A Economia que Torna o KYC Inevitável

Treinar um modelo de ponta hoje custa entre 100 milhões e 1 bilião de dólares apenas em computação. GPT-4, Claude 3.5 Opus, Gemini Ultra, Grok 3 — todos estão nessa faixa. A próxima geração ultrapassará os 1 a 10 biliões de dólares.

A destilação custa aproximadamente 0,1% disso. Dê a um modelo mais fraco alguns milhões de exemplos de alta qualidade de um modelo mais forte, ajuste-o por algumas semanas e terá recuperado uma grande fração da capacidade do modelo-alvo na maioria dos benchmarks.

A diferença entre "treinar um modelo de ponta" e "destilar um modelo de ponta" é de três ordens de magnitude. Essa assimetria é o facto económico mais importante na IA atualmente. Explica porque todos os principais laboratórios de ponta já estão a executar um programa de KYC ou têm um em fase de desenvolvimento ativo.

Sem KYC, o ataque é trivial:

Registe-se com o maior número possível de contas de API que conseguir automatizar
Encaminhe o tráfego através de proxies residenciais para contornar os limites de taxa de IP
Utilize e-mails fabricados, números de telefone alugados e cartões pré-pagos
Extraia alguns milhões de rastros de raciocínio em tarefas de codificação, matemática, utilização de ferramentas e agentes
Treine o seu próprio modelo com base no conjunto de dados
Lance-o gratuitamente ou a uma fração do preço original

A fatura total para o atacante é de dezenas de milhares de dólares em gastos com API. O prejuízo comercial para o laboratório cujo modelo foi destilado é de biliões. Este não é um sistema estável.

Como a Destilação Realmente se Manifesta

O artigo técnico da Anthropic descreveu os padrões de ataque com clareza invulgar. As assinaturas que detetaram incluem:

Modelos de prompt repetitivos em centenas de contas coordenadas, concebidos para provocar cadeias de raciocínio consistentes
Padrões de elicitação de cadeia de pensamento — prompts que forçam o modelo a expor o seu raciocínio completo, que é então copiado como dados de treino
Tráfego focado em capacidades — frotas inteiras de contas focadas exclusivamente em codificação, utilização de ferramentas de agentes ou raciocínio matemático, dependendo da capacidade-alvo
Arquiteturas de "cluster Hydra" — redes de contas distribuídas por APIs e fornecedores de nuvem para permanecerem abaixo dos limiares de anomalia por ponto final
Serviços de proxy comerciais que gerenciam dezenas de milhares de contas simultaneamente, misturando tráfego de destilação com cargas de trabalho legítimas para envenenar o sinal

Os atores nomeados — DeepSeek, Moonshot AI, MiniMax — foram responsáveis por operações específicas:

MiniMax: 13 milhões de interações, focadas na codificação de agentes e orquestração de ferramentas
Moonshot AI: 3,4 milhões de interações, abrangendo raciocínio de agentes, codificação e visão computacional
DeepSeek: 150.000 interações, extraindo capacidades de raciocínio

Todos os laboratórios de ponta presumem que o mesmo ataque está a ser executado contra eles. A maioria ainda não está a publicar os números.

Porque Específicamente KYC

Existem muitas defesas possíveis contra a destilação. O KYC não é o único e, por si só, não é suficiente. No entanto, é a camada fundamental que faz com que todas as outras defesas funcionem.

A Deteção Sem Identidade é um Peneiro com Furos

Pode construir excelentes classificadores comportamentais que detetem padrões de destilação. A Anthropic fez isso. Mas se um atacante conseguir criar 1.000 novas contas por hora, o valor do seu classificador diminui rapidamente. Cada conta banida é substituída antes que termine de escrever a justificativa do banimento.

Com identidade verificada, cada conta banida impõe um custo real ao atacante — precisam de uma nova identidade, um novo documento, uma nova biometria. Em algum ponto de preço, o ataque deixa de ser lucrativo.

Recursos Legais Requerem um Réu Real

A Anthropic pode processar a DeepSeek. Não pode processar "conta-98234@tempmail.com". As violações dos termos de serviço só são exequíveis se souber quem as violou. O KYC transforma os termos de serviço de um documento simbólico num contrato acionável.

Os Controles de Segurança Colapsam Sem Identidade

Todo o catálogo de implantações com base em capacidade — níveis de elevação de biosegurança, fluxos de trabalho de controlo de exportação, bloqueio de entidades sancionadas, proteção de menores — depende de conhecer, no mínimo, a jurisdição, a idade e o estatuto jurídico do utilizador. Não pode filtrar quem não identifica.

Os Reguladores Estão a Chegar

A Lei de IA da UE está em vigor. O Instituto de Segurança de IA do Reino Unido tem acordos de teste diretos com laboratórios de ponta. A ordem executiva dos EUA sobre IA define limites de notificação. A Administração do Ciberespaço da China já exige a verificação de identidade na IA generativa. O KYC no acesso à IA está a passar de boa prática para expectativa regulamentar em todas as principais jurisdições.

O Plano de Ação Emergente para KYC de LLM

A forma como o KYC para plataformas de IA está a convergir rapidamente. Com base no que a Anthropic, a OpenAI, Google DeepMind e os maiores fornecedores de nuvem de IA empresarial estão a fazer agora, o programa padrão parece-se com isto.

Nível 1: Acesso Público

Nível gratuito, produtos de chat de consumidor. Verificação de e-mail, verificação de telefone, impressão digital do dispositivo, CAPTCHAs. Sem verificação de documentos, a menos que os sinais de risco a desencadeiem. O objetivo é filtrar abusos óbvios sem destruir o funil de inscrição.

Nível 2: Acesso à API

Clientes de API pagos. Verificação do método de pagamento como identidade proxy (KYC de nível Stripe), mais alguma combinação de:

Verificação de telefone no registo
Geolocalização de IP e rastreio de jurisdição
Verificação do domínio de e-mail da organização para empresas
Verificação de ID ativada por limiares de volume, nível de capacidade ou sinais de anomalia

É aqui que se encontra a implementação atual do Claude da Anthropic.

Nível 3: Diligência Devida Aprimorada

Contratos empresariais, compromissos de inferência em massa, acesso a capacidades de ponta (raciocínio de contexto longo, utilização de ferramentas de agentes, codificação em larga escala). A pilha KYC completa:

Verificação de documento de identificação emitido pelo governo com deteção de vida
Selfie biométrico correspondente à foto do documento de identificação
Rastreio de sanções, PEP e meios de comunicação adversos
Propriedade benéfica para clientes corporativos
Origem dos fundos para compromissos muito grandes
Declaração de uso pretendido com restrições contratuais

Nível 4: Capacidades de Alto Risco

Qualquer coisa que ultrapasse a Política de Escala Responsável do laboratório ou limite equivalente — modelos de melhoramento biológico, agentes autónomos com acesso a gravação no mundo real, capacidades cibernéticas de uso duplo. Integração personalizada com revisão manual, verificação de clientes governamentais, conformidade de controlo de exportação, reverificação periódica.

A maioria dos utilizadores finais só verá o Nível 1. Os desenvolvedores viverão no Nível 2. Os clientes empresariais experimentarão o Nível 3. O Nível 4 é reservado para um pequeno número de entidades aprovadas sob supervisão governamental direta.

O Que os Laboratórios de Ponta Estão a Fazer Errado

As primeiras implementações estão a aprender com a experiência e os erros são instrutivos.

Implementações Silenciosas Destroem a Confiança

A Anthropic lançou a verificação de identidade no Claude com um único artigo de ajuda. Sem postagem de blog. Sem aviso prévio. Sem escopo publicado. A reação resultante foi previsível e amplamente evitável. Os usuários aceitam o KYC quando a justificativa é clara e o tratamento de dados é explícito. Eles se rebelam quando a verificação aparece da noite para o dia sem explicação.

Triggers Não Claros Criam Paranoia

"Alguns usuários, para alguns recursos" é uma estratégia de implementação razoável, mas uma estratégia de comunicação terrível. Os usuários presumem o pior — que o gatilho é político, ideológico ou arbitrário. Publique os gatilhos. "Verificamos quando ultrapassa X solicitações/dia, quando acessa Y recurso ou quando nossos sinais de fraude sinalizam um padrão Z" é uma mensagem muito melhor do que implementações opacas.

Manter Dados Biométricos Internamente é um Erro

Todos os laboratórios de ponta que construíram sua própria pilha de verificação de identidade vão se arrepender disso dentro de dois anos. A custódia biométrica é um negócio especializado, regulamentado e auditado. Faça parceria com um fornecedor dedicado (Persona, Onfido, Didit) e saia do negócio de custódia de dados. A Anthropic acertou nessa parte.

Ignorar a Experiência do Desenvolvedor

Se o KYC bloquear o seu cliente de API por dois dias enquanto um revisor analisa um documento escaneado confuso, perdeu esse cliente. Os melhores fluxos de verificação são concluídos em menos de 90 segundos num dispositivo móvel com verificações de vida em tempo real e revisão automatizada de documentos. Qualquer coisa mais lenta é uma desvantagem competitiva.

O Que Todo Produto de IA Deve Fazer, Não Apenas os Laboratórios de Ponta

Se estiver a construir com base numa API de LLM — um chatbot, uma plataforma de agentes, uma ferramenta de codificação, um produto de conteúdo — não está isento desta mudança. Está a jusante dela.

Três recomendações práticas:

1. Assuma que o seu Provedor Upstream Irá Exigir Mais Verificação

A Anthropic exigirá mais de seus clientes de API ao longo do tempo. Da mesma forma, a OpenAI. Se a sua empresa não conseguir passar pela diligência devida aprimorada (propriedade benéfica verificada, declarações de uso pretendido, rastreio de controlo de exportação), o seu acesso à API estará em risco. Limpe a postura KYC da sua empresa agora, antes que se torne uma emergência.

2. Implemente KYC Baseado em Risco em Seus Próprios Usuários

O seu produto provavelmente está a ser abusado nas mesmas taxas que os laboratórios de ponta. Agentes de spam, redes de raspagem, bots de personificação, esquemas de fraude. A arquitetura correta:

Baixa fricção no registo — e-mail, telefone, impressão digital do dispositivo
Verificação ativada por sinais de risco — volume, anomalia, padrões suspeitos, recursos sensíveis
Verificação aprimorada para níveis pagos — documento + vida + rastreio de sanções
Monitoramento contínuo — impressões digitais comportamentais, reverificação em anomalias

Este é o mesmo modelo baseado em risco que os bancos usam há décadas, adaptado para produtos de IA.

3. Escolha um Fornecedor de Identidade Que Se Adapte aos Fluxos de Trabalho de IA

Os fornecedores de KYC tradicionais foram criados para bancos. São lentos, caros e otimizados para a métrica errada. Os produtos de IA precisam de:

Verificação rápida — menos de 90 segundos de ponta a ponta
Preços baseados no uso — sem mínimos, sem contratos empresariais para experimentação
Ampla cobertura de documentos — 14.000+ tipos de documentos em 220+ países (os produtos de IA são globais desde o primeiro dia)
Deteção de vida real — porque a fraude impulsionada por deepfake já é a norma em 2026
API limpa — porque as empresas de IA são enviadas semanalmente, não trimestralmente

Esta é a lacuna que a Didit foi construída para preencher: infraestrutura de identidade principal para IA a $0,30 por verificação, sem contratos, sem mínimos, 500 verificações gratuitas por mês. É a forma de verificação de identidade que se adapta à forma como as empresas de IA realmente constroem e escalam.

O Jogo Final

Daqui a cinco anos, o registo numa conta de API com um laboratório de IA de ponta parecer-se-á com a abertura de uma conta de corretagem. Identidade verificada. Verificações da origem dos fundos para grandes compromissos. Monitoramento contínuo. Relatórios de atividades suspeitas. Reverificação periódica.

Isso pode parecer distópico para algumas pessoas. No entanto, é o resultado lógico de duas forças: o custo assombroso do treino de ponta e a capacidade assombrosa do que está a ser treinado. Quando a coisa do outro lado da API puder melhorar significativamente um programa de armas biológicas ou ser destilada num produto que destrua biliões em valor empresarial, a camada de acesso tem de se parecer com uma infraestrutura financeira regulamentada.

Os laboratórios que descobrem como fazer isso sem prejudicar a experiência do desenvolvedor vencerão. Os que se recusam a verificar (e se tornam irrelevantes por destilação) ou verificam mal (e perdem desenvolvedores para os concorrentes) não o farão.

KYC não é o inimigo da inovação na IA. A destilação descontrolada é. Quanto mais cedo a indústria internalizar isso, melhor será o equilíbrio para todos — laboratórios, desenvolvedores, clientes empresariais e os usuários que dependem da camada de IA para continuar a existir.

---

Didit fornece infraestrutura de verificação de identidade construída para produtos de IA nativos. Verificação de documentos, biometria de vida, rastreio AML, monitoramento contínuo — a $ 0,30 por verificação, em mais de 220 países. Comece de graça.

Continua a ler