Blog · 16 d’abril del 2026

KYC en l'Era dels LLM: Per què els Laboratoris d'IA d'Avantguarda Necessiten la Verificació d'Identitat per Sobrevindre (CA)

Els models d'avantguarda costen centenes de milions a entrenar i es poden destil·lar per pocs cèntims. La verificació d'identitat per a l'accés a l'API està fent-se obligatòria.

Per Didit16 d’abril del 2026Actualitzat el 22 de maig del 2026

Al febrer de 2026, Anthropic va publicar evidències que tres laboratoris xinesos d'IA havien realitzat col·lectivament 16 milions d'intercanvis amb Claude utilitzant 24.000 comptes fraudulents. L'objectiu no era l'experimentació casual. Era una destil·lació a escala industrial: entrenar models més barats i més febles amb les sortides del sistema d'IA més car que s'ha construït mai.

Dos mesos després, Anthropic va implementar la verificació d'identitat per passaport i selfie a Claude.

Aquesta seqüència no és una coincidència. És la història de compliment definidora de l'era LLM. La IA d'avantguarda està sent arrossegada, ràpidament i inevitablement, a la mateixa disciplina de "coneix el teu client, monitora el teu client" sota la qual viuen els bancs, els intermediaris i les borses de criptomonedes. Aquesta publicació explica per què, com és a la pràctica i què hauria de fer cada empresa d'IA —no només els laboratoris d'avantguarda—.

L'Economia que Fa Inevitable el KYC

Entrenar un model d'avantguarda avui dia costa entre 100 milions i 1.000 milions de dòlars només en computació. GPT-4, Claude 3.5 Opus, Gemini Ultra, Grok 3 — tots se situen en aquest rang. La propera generació superarà els 1.000 milions a 10.000 milions de dòlars.

La destil·lació costa aproximadament el 0,1% d'això. Doneu a un model més feble uns quants milions d'exemples d'alta qualitat d'un model més fort, afineu-lo durant setmanes i haureu recuperat una gran fracció de la capacitat del model objectiu en la majoria dels punts de referència.

La bretxa entre "entrenar un model d'avantguarda" i "destil·lar un model d'avantguarda" és de tres ordres de magnitud. Aquesta asimetria és el fet econòmic més important en la IA actualment. Explica per què cada laboratori d'avantguarda important ja està executant un programa KYC o n'ha d'un en desenvolupament actiu.

Sense KYC, l'atac és trivial:

Registra't al màxim nombre possible de comptes d'API que puguis automatitzar
Ruta el trànsit a través de proxies residencials per evitar els límits de velocitat d'IP
Utilitza correus electrònics fabricats, números de telèfon de lloguer i targetes prepagament
Extreu uns quants milions de traces de raonament en codificació, matemàtiques, ús d'eines i tasques agentic
Entrena el teu propi model amb el conjunt de dades
Allibera'l gratuïtament o a una fracció del preu original

La factura total per a l'atacant són desenes de milers de dòlars en despeses d'API. El dany comercial al laboratori el model del qual va ser destil·lat és de milers de milions. Aquest no és un sistema estable.

Com és Realment la Destil·lació

L'article tècnic d'Anthropic va descriure els patrons d'atac amb una claredat inusual. Les signatures que van detectar inclouen:

Plantilles de prompts repetitives a centenars de comptes coordinats, dissenyades per elicitar cadenes de raonament consistents
Patrons d'elicitation de cadena de pensament: prompts que obliguen el model a exposar tot el seu raonament, que després es rasca com a dades d'entrenament
Tràfic orientat a la capacitat: flotes senceres de comptes centrades exclusivament en la codificació, l'ús d'eines agentic o el raonament matemàtic, depenent de la capacitat objectiu
Arquitectures de clúster "Hydra": xarxes de comptes distribuïdes a través d'APIs i proveïdors de núvol per romandre per sota dels llindars d'anomalies per punt final
Serveis de proxy comercials gestionant desenes de milers de comptes simultàniament, barrejant el trànsit de destil·lació amb càrregues de treball legítimes per enverinar el senyal

Els actors nomenats —DeepSeek, Moonshot AI, MiniMax— van ser responsables d'operacions específiques:

MiniMax: 13 milions d'intercanvis, centrats en la codificació agentic i l'orquestració d'eines
Moonshot AI: 3,4 milions d'intercanvis, que abasten el raonament agentic, la codificació i la visió per ordinador
DeepSeek: 150.000 intercanvis, extreient capacitats de raonament

Cada laboratori d'avantguarda assumeix que el mateix atac s'està duent a terme contra ells. La majoria encara no publiquen les xifres.

Per què Específicament KYC

Hi ha moltes defenses possibles contra la destil·lació. KYC no és l'única, i per si sola no és suficient. No obstant això, és la capa fonamental que fa que totes les altres defenses funcionin.

La Detecció Sense Identitat És un Colador

Podeu construir excel·lents classificadors de comportament que detectin patrons de destil·lació. Anthropic ho va fer. Però si l'atacant pot crear 1.000 nous comptes en una hora, el valor del vostre classificador disminueix ràpidament. Cada compte prohibit es reemplaça abans d'acabar d'escriure la justificació de la prohibició.

Amb una identitat verificada, cada compte prohibit imposa un cost real a l'atacant: necessiten una nova identitat, un nou document, una nova biomètria. A partir d'un determinat preu, l'atac deixa de ser rendible.

El Recurs Legal Requereix un Defendant Real

Anthropic pot demandar DeepSeek. No pot demandar "compte-98234@tempmail.com". Les infraccions de les condicions del servei només són exigibles si saps qui les ha violat. KYC transforma les condicions del servei d'un document simbòlic en un contracte accionable.

Els Controls de Seguretat Col·lapsen Sense Identitat

Tot el catàleg de desplegaments amb control de capacitats —llindars d'elevació de la bioseguretat, fluxos de treball de control d'exportacions, bloqueig d'entitats sancionades, protecció de menors— depèn de conèixer, com a mínim, la jurisdicció, l'edat i l'estat legal de l'usuari. No pots filtrar a qui no identifiques.

Els Reguladors Estan Arribant

La Llei d'IA de la UE està en vigor. L'Institut de Seguretat de la IA del Regne Unit té acords de proves directes amb els laboratoris d'avantguarda. L'ordre executiva dels Estats Units sobre la IA estableix llindars d'informe. L'Administració del Ciberespai de la Xina ja exigeix la verificació de la identitat a la IA generativa. El KYC en l'accés a la IA es mou de la millor pràctica a l'expectativa regulatòria a totes les jurisdiccions importants.

El Pla d'Acció Emergent per a KYC LLM

La forma del KYC per a les plataformes d'IA està convergent ràpidament. Basat en el que Anthropic, OpenAI, Google DeepMind i els proveïdors de núvol d'IA empresarial més grans estan fent ara, el programa estàndard sembla així.

Nivell 1: Accés Públic

Versió gratuïta, productes de xat per a consumidors. Verificació per correu electrònic, verificació per telèfon, impressió digital del dispositiu, CAPTCHA. Sense verificació de documents tret que els senyals de risc ho desencadenin. L'objectiu és filtrar els abusos evidents sense destruir l'embut d'inscripció.

Nivell 2: Accés a l'API

Clients d'API de pagament. Verificació del mètode de pagament com a identitat proxy (KYC de Stripe), més alguna combinació de:

Verificació per telèfon durant la inscripció
Geolocalització de l'IP i cribratge de jurisdicció
Verificació del domini de correu electrònic de l'organització per a empreses
Verificació de la identitat desencadenada per llindars de volum, nivell de capacitat o senyals d'anomalia

Aquí és on es troda el llançament actual de Claude d'Anthropic.

Nivell 3: Diligència Deguda Millorada

Contractes empresarials, compromisos d'inferència a granel, accés a capacitats d'avantguarda (raonament de context llarg, ús d'eines agentic, codificació a escala). La pila KYC completa:

Verificació de la identificació emesa pel govern amb detecció de vivacitat
Selfie biomètric coincidint amb la foto de la identificació
Cribratge de sancions, PEP i mitjans adversos
Beneficiaris reals per a clients corporatius
Origen dels fons per a compromisos molt grans
Atestació d'ús previst amb restriccions contractuals

Nivell 4: Capacitats d'Alt Risc

Qualsevol cosa que superi la Política d'Escalada Responsable del laboratori o l'equivalent: models d'elevació biològica, agents autònoms amb accés d'escriptura al món real, capacitats cibernètiques amb doble ús. Incorporació personalitzada amb revisió manual, verificació del client governamental, compliment del control d'exportacions, reverificació periòdica.

La majoria dels usuaris només veuran el Nivell 1. Els creadors viuran al Nivell 2. Els clients empresarials experimentaran el Nivell 3. El Nivell 4 està reservat per a un petit nombre d'entitats aprovades sota la supervisió directa del govern.

El Que Els Laboratoris d'Avantguarda Estan Fent Malament

Els llançaments inicials estan aprenent sobre la marxa i els errors són instructius.

Els Lançaments Silenciosos Destrueixen la Confiança

Anthropic va llançar la verificació d'identitat a Claude amb un sol article d'ajuda. Sense publicació de bloc. Sense avís previ. Sense abast publicat. La reacció resultant va ser previsible i en gran mesura evitable. Els usuaris accepten el KYC quan la justificació és clara i el maneig de les dades és explícit. Es rebel·len quan la verificació apareix de la nit al dia sense cap explicació.

Els Desencadenants Poc Clars Creen Paranoia

"Alguns usuaris, per a algunes funcions" és una estratègia de llançament raonable, però una estratègia de comunicació terrible. Els usuaris assumeixen el pitjor: que el desencadenant és polític, ideològic o arbitrari. Publica els desencadenants. "Verifiquem quan excediu X sol·licituds/dia, quan accediu a Y capacitat o quan els nostres senyals de frau marquen el patró Z" és un missatge molt millor que els llançaments opacs.

Mantenir les Dades Biométriques Internament és un Error

Cada laboratori d'avantguarda que hagi creat la seva pròpia pila de verificació d'identitat s'ho lamentarà en menys de dos anys. La custòdia biomètrica és un negoci especialitzat, regulat i auditat. Associa't amb un proveïdor dedicat (Persona, Onfido, Didit) i mantingues-te fora del negoci de la custòdia de dades. Anthropic va fer bé això.

Ignorar l'Experiència del Desenvolupador

Si el KYC bloqueja el teu client d'API durant dos dies mentre un revisor examina un escaneig de document borbós, has perdut aquest client. Els millors fluxos de verificació es completen en menys de 90 segons en un dispositiu mòbil amb comprovacions de vivacitat en temps real i revisió automatitzada de documents. Qualsevol cosa més lenta és un desavantatge competitiu.

Què Ha De Fer Cada Producte d'IA, No Només Els Laboratoris d'Avantguarda

Si estàs construint a partir d'una API LLM —un chatbot, una plataforma agentic, una eina de codificació, un producte de contingut— no estàs exempt d'aquest canvi. Estàs a la part inferior d'aquest.

Tres recomanacions pràctiques:

1. Assumeix que el teu Proveïdor Upstream Requerirà Més Verificació

Anthropic demanarà més als seus clients d'API amb el temps. Així doncs, OpenAI. Si la teva empresa no pot superar la diligència deguda millorada (propietat beneficiosa verificada, atestacions d'ús previst, cribratge de control d'exportacions), el teu accés a l'API està en risc. Neteja la teva postura KYC corporativa ara, abans que sigui una emergència.

2. Implementa el KYC Basat en el Risc als Teus Propis Usuaris

El teu producte probablement està sent abusat a les mateixes taxes que els laboratoris d'avantguarda. Agents de spam, xarxes de scrapping, bots d'imitació, anells de frau. L'arquitectura correcta:

Baix fricció en la inscripció: correu electrònic, telèfon, impressió digital del dispositiu
Verificació desencadenada per senyals de risc: volum, anomalia, patrons sospitosos, funcions sensibles
Verificació millorada per a nivells de pagament: document + vivacitat + cribratge de sancions
Monitoratge continu: empremtes digitals de comportament, reverificació en anomalies

Aquest és el mateix model basat en el risc que els bancs han utilitzat durant dècades, adaptat per als productes d'IA.

3. Tria un Proveïdor d'Identitat que S'Adapta als Fluxos de Treball de la IA

Els proveïdors de KYC tradicionals estaven construïts per als bancs. Són lents, cars i optimitzats per a la mesura incorrecta. Els productes d'IA necessiten:

Verificació ràpida: menys de 90 segons de principi a fi
Preus basats en l'ús: sense mínims, sense contractes empresarials per a l'experimentació
Cobertura àmplia de documents: 14.000+ tipus de documents a 220+ països (els productes d'IA són globals des del primer dia)
Detecció de vivacitat real: perquè el frau impulsat per deepfake ja és la norma el 2026
API neta: perquè les empreses d'IA envien setmanalment, no trimestralment

Aquesta és la bretxa Didit per a la qual va ser construït: infraestructura d'identitat bàsica per a la IA, a 0,30 dòlars per verificació, sense contractes, sense mínims, 500 comprovacions gratuïtes al mes. Aquesta és la forma de verificació d'identitat que coincideix amb la manera com les empreses d'IA construeixen i escalen.

El Joc Final

D'aquí cinc anys, registrar-se en un compte d'API amb un laboratori d'IA d'avantguarda se sentirà com obrir un compte de corretatge. Identitat verificada. Comprovacions de l'origen dels fons per a compromisos grans. Monitoratge continu. Informes d'activitat sospitosa. Reverificació periòdica. Accés escalonat mapejat a nivells de capacitat.

Això semblarà distòpic a algunes persones. No obstant això, és el punt final lògic de dues forces: el cost impressionant de l'entrenament d'avantguarda i la capacitat impressionant del que s'està entrenant. Quan la cosa que hi ha a l'altra banda de l'API pugui millorar significativament un programa de bioweapons o ser destil·lada en un producte que destrueixi milers de milions de valor empresarial, la capa d'accés ha de semblar una infraestructura financera regulada.

Els laboratoris que descobreixin com fer-ho sense trencar l'experiència del desenvolupador guanyaran. Els que es neguen a verificar (i es destil·len fins a la irrelevància) o verifiquen malament (i perden els desenvolupadors davant els competidors) no ho faran.

El KYC no és l'enemic de la innovació en la IA. La destil·lació sense control ho és. Com més aviat la indústria internalitzi això, millor serà l'equilibri per a tothom: laboratoris, desenvolupadors, clients empresarials i els usuaris que depenen de la capa d'IA que continua existint.

---

Didit proporciona infraestructura de verificació d'identitat construïda per a productes d'IA nadius. Verificació de documents, biomètria de vivacitat, cribratge AML, monitoratge continu: a 0,30 dòlars per comprovació, a 220+ països. Comença gratis.