Verificación de Identidad en la Era de los LLM: Por Qué los Laboratorios de IA de Vanguardia Necesitan Verificar la Identidad para Sobrevivir (ES)
Entrenar modelos de vanguardia cuesta cientos de millones, pero su destilación puede costar céntimos. La verificación de identidad en el acceso a las API se está volviendo obligatoria.

En febrero de 2026, Anthropic publicó evidencia de que tres laboratorios chinos de IA habían realizado colectivamente 16 millones de intercambios con Claude utilizando 24,000 cuentas fraudulentas. El propósito no era una experimentación casual. Se trataba de destilación a escala industrial: entrenar modelos más baratos y débiles con las salidas del sistema de IA más caro jamás construido.
Dos meses después, Anthropic implementó la verificación de identidad con pasaporte y selfie en Claude.
Esta secuencia no es una coincidencia. Es la historia de cumplimiento definitoria de la era LLM. La IA de vanguardia está siendo arrastrada, rápida e inevitablemente, a la misma disciplina de "conoce a tu cliente, monitorea a tu cliente" bajo la que operan los bancos, corredores y bolsas de criptomonedas. Esta publicación explica por qué, cómo se ve en la práctica y qué debe hacer toda empresa de IA, no solo los laboratorios de vanguardia.
La Economía Que Hace Que el KYC Sea Inevitable
Entrenar un modelo de vanguardia hoy en día cuesta entre 100 millones y 1 mil millones de dólares solo en computación. GPT-4, Claude 3.5 Opus, Gemini Ultra, Grok 3, todos se sitúan en ese rango. La próxima generación superará los 1 a 10 mil millones de dólares.
La destilación cuesta aproximadamente el 0.1% de eso. Dele a un modelo más débil algunos millones de ejemplos de alta calidad de uno más fuerte, afínelo durante unas semanas y habrá recuperado una gran fracción de la capacidad del modelo objetivo en la mayoría de las pruebas de referencia.
La brecha entre "entrenar un modelo de vanguardia" y "destilar un modelo de vanguardia" es de tres órdenes de magnitud. Esa asimetría es el hecho económico más importante en la IA en este momento. Explica por qué cada laboratorio de vanguardia importante ya está ejecutando un programa KYC o tiene uno en desarrollo activo.
Sin KYC, el ataque es trivial:
- Regístrese con tantas cuentas de API como pueda automatizar
- Enrute el tráfico a través de proxies residenciales para evitar los límites de velocidad de IP
- Utilice correos electrónicos fabricados, números de teléfono alquilados y tarjetas prepagas
- Extraiga algunos millones de rastros de razonamiento en codificación, matemáticas, uso de herramientas y tareas de agentes
- Entrene su propio modelo con el conjunto de datos
- Publíquelo de forma gratuita o a una fracción del precio original
La factura total para el atacante son decenas de miles de dólares en gastos de API. El daño comercial al laboratorio cuyo modelo fue destilado es de miles de millones. Este no es un sistema estable.
Cómo se Ve Realmente la Destilación
El documento técnico de Anthropic describió los patrones de ataque con una claridad inusual. Las firmas que detectaron incluyen:
- Plantillas de indicaciones repetitivas en cientos de cuentas coordinadas, diseñadas para provocar cadenas de razonamiento consistentes
- Patrones de elicitación de cadena de pensamiento: indicaciones que obligan al modelo a exponer todo su razonamiento, que luego se extrae como datos de entrenamiento
- Tráfico dirigido a la capacidad: flotas enteras de cuentas enfocadas exclusivamente en codificación, uso de herramientas de agentes o razonamiento matemático, según la capacidad objetivo
- Arquitecturas de "clúster Hydra": redes de cuentas distribuidas en API y proveedores de nube para mantenerse por debajo de los umbrales de anomalías por punto final
- Servicios de proxy comerciales que administran decenas de miles de cuentas simultáneamente, mezclando el tráfico de destilación con cargas de trabajo legítimas para envenenar la señal
Los actores nombrados —DeepSeek, Moonshot AI, MiniMax— fueron responsables de operaciones específicas:
- MiniMax: 13 millones de intercambios, centrados en la codificación de agentes y la orquestación de herramientas
- Moonshot AI: 3.4 millones de intercambios, que cubren el razonamiento de agentes, la codificación y la visión artificial
- DeepSeek: 150,000 intercambios, extrayendo capacidades de razonamiento
Cada laboratorio de vanguardia asume que el mismo ataque se está ejecutando en su contra. La mayoría aún no publica los números.
Por Qué KYC Específicamente
Hay muchas defensas posibles contra la destilación. KYC no es la única y, por sí sola, no es suficiente. Sin embargo, es la capa fundamental que hace que todas las demás defensas funcionen.
La Detección Sin Identidad Es Un Colador
Puede construir excelentes clasificadores de comportamiento que detecten patrones de destilación. Anthropic lo hizo. Pero si el atacante puede iniciar 1,000 nuevas cuentas en una hora, el valor de su clasificador disminuye rápidamente. Cada cuenta prohibida se reemplaza antes de que termine de redactar la justificación de la prohibición.
Con una identidad verificada, cada cuenta prohibida impone un costo real al atacante: necesitan una nueva identidad, un nuevo documento, una nueva medición biométrica. En algún punto de precio, el ataque deja de ser rentable.
El Recurso Legal Requiere Un Demandado Real
Anthropic puede demandar a DeepSeek. No puede demandar a "cuenta-98234@tempmail.com". Las violaciones de los términos de servicio solo son exigibles si sabe quién las violó. KYC transforma los términos de servicio de un documento simbólico en un contrato ejecutable.
Los Controles De Seguridad Colapsan Sin Identidad
Todo el catálogo de implementaciones con control de capacidad: umbrales de mejora de la bioseguridad, flujos de trabajo de control de exportaciones, bloqueo de entidades sancionadas, protección de menores, depende de conocer, como mínimo, la jurisdicción, la edad y el estado legal del usuario. No puede filtrar a quien no identifica.
Los Reguladores Están Llegando
La Ley de IA de la UE está en vigor. El Instituto de Seguridad de la IA del Reino Unido tiene acuerdos de prueba directos con laboratorios de vanguardia. La orden ejecutiva de EE. UU. sobre IA establece umbrales de informes. La Administración del Ciberspacio de China ya exige la verificación de identidad en la IA generativa. El KYC en el acceso a la IA está pasando de ser una mejor práctica a una expectativa regulatoria en todas las jurisdicciones principales.
El Libro de Jugadas Emergente para KYC de LLM
La forma del KYC para las plataformas de IA está convergiendo rápidamente. Basado en lo que Anthropic, OpenAI, Google DeepMind y los proveedores de nube de IA empresariales más grandes están haciendo ahora, el programa estándar se ve así.
Nivel 1: Acceso Público
Nivel gratuito, productos de chat para consumidores. Verificación de correo electrónico, verificación de teléfono, huella digital del dispositivo, CAPTCHA. Sin verificación de documentos a menos que las señales de riesgo lo activen. El objetivo es filtrar el abuso obvio sin destruir el embudo de registro.
Nivel 2: Acceso a la API
Clientes de API de pago. Verificación del método de pago como identidad proxy (KYC de nivel Stripe), más una combinación de:
- Verificación de teléfono en el registro
- Geolocalización de IP y selección de jurisdicción
- Verificación del dominio de correo electrónico de la organización para empresas
- Verificación de identidad activada por umbrales de volumen, nivel de capacidad o señales de anomalía
Aquí es donde se encuentra el lanzamiento actual de Claude de Anthropic.
Nivel 3: Diligencia Debida Mejorada
Contratos empresariales, compromisos de inferencia masiva, acceso a capacidades de vanguardia (razonamiento de contexto largo, uso de herramientas de agentes, codificación a escala). La pila KYC completa:
- Verificación de la identificación emitida por el gobierno con detección de vida
- Selfie biométrico emparejado con la foto de la identificación
- Selección de sanciones, PEP y medios adversos
- Beneficios reales para clientes corporativos
- Fuente de fondos para compromisos muy grandes
- Atestación de uso previsto con restricciones contractuales
Nivel 4: Capacidades de Alto Riesgo
Cualquier cosa que cruce la Política de Escalado Responsable del laboratorio o un umbral equivalente: modelos de mejora de la biología, agentes autónomos con acceso de escritura en el mundo real, capacidades cibernéticas de doble uso. Incorporación personalizada con revisión manual, verificación de clientes gubernamentales, cumplimiento del control de exportaciones, re-verificación periódica.
La mayoría de los usuarios solo verán el Nivel 1. Los creadores vivirán en el Nivel 2. Los clientes empresariales experimentarán el Nivel 3. El Nivel 4 está reservado para un pequeño número de entidades aprobadas bajo la supervisión directa del gobierno.
Lo Que Los Laboratorios De Vanguardia Están Haciendo Mal
Los primeros lanzamientos están aprendiendo sobre la marcha, y los errores son instructivos.
Los Lanzamientos Silenciosos Destruyen La Confianza
Anthropic lanzó la verificación de identidad en Claude con un solo artículo de ayuda. Sin publicación de blog. Sin preaviso. Sin alcance publicado. La reacción resultante fue predecible y en gran medida evitable. Los usuarios aceptan el KYC cuando la razón es clara y el manejo de los datos es explícito. Se rebelan cuando la verificación aparece de la noche a la mañana sin explicación.
Los Desencadenantes Poco Claros Crean Paranoia
"Algunos usuarios, para algunas funciones" es una estrategia de lanzamiento razonable, pero una estrategia de comunicación terrible. Los usuarios asumen lo peor: que el desencadenante es político, ideológico o arbitrario. Publique los desencadenantes. "Verificamos cuando excede X solicitudes/día, cuando accede a la función Y o cuando nuestras señales de fraude marcan el patrón Z" es un mensaje mucho mejor que lanzamientos opacos.
Mantener Los Datos Biométricos Internamente Es Un Error
Cada laboratorio de vanguardia que haya construido su propia pila de verificación de identidad se arrepentirá dentro de dos años. La custodia biométrica es un negocio especializado, regulado y auditado. Asóciese con un proveedor dedicado (Persona, Onfido, Didit) y salga del negocio de la custodia de datos. Anthropic acertó en este punto.
Ignorar La Experiencia Del Desarrollador
Si el KYC bloquea a su cliente de API durante dos días mientras un revisor examina un escaneo de documento borroso, ha perdido a ese cliente. Los mejores flujos de verificación se completan en menos de 90 segundos en un dispositivo móvil con verificaciones de vida en tiempo real y revisión automatizada de documentos. Cualquier cosa más lenta es una desventaja competitiva.
Qué Debe Hacer Todo Producto De IA, No Solo Los Laboratorios De Vanguardia
Si está construyendo sobre una API de LLM: un chatbot, una plataforma de agentes, una herramienta de codificación, un producto de contenido, no está exento de este cambio. Está aguas abajo de él.
Tres recomendaciones prácticas:
1. Asuma Que Su Proveedor Ascendente Requerirá Más Verificación
Anthropic pedirá más a sus clientes de API con el tiempo. Al igual que OpenAI. Si su empresa no puede pasar una diligencia debida mejorada (beneficios reales verificados, atestaciones de uso previsto, selección de control de exportaciones), su acceso a la API corre peligro. Limpie su postura KYC corporativa ahora, antes de que sea una emergencia.
2. Implemente KYC Basado En El Riesgo En Sus Propios Usuarios
Su producto probablemente se está abusando a las mismas tasas que los laboratorios de vanguardia. Agentes de spam, redes de scraping, bots de suplantación de identidad, anillos de fraude. La arquitectura correcta:
- Baja fricción en el registro: correo electrónico, teléfono, huella digital del dispositivo
- Verificación activada por señales de riesgo: volumen, anomalía, patrones sospechosos, características sensibles
- Verificación mejorada para niveles de pago: documento + vida + selección de sanciones
- Monitoreo continuo: huellas digitales de comportamiento, re-verificación en anomalías
Este es el mismo modelo basado en el riesgo que los bancos han utilizado durante décadas, adaptado para productos de IA.
3. Elija Un Proveedor De Identidad Que Se Ajuste A Los Flujos De Trabajo De IA
Los proveedores de KYC heredados fueron diseñados para los bancos. Son lentos, caros y optimizados para la métrica equivocada. Los productos de IA necesitan:
- Verificación rápida: menos de 90 segundos de extremo a extremo
- Precios basados en el uso: sin mínimos, sin contratos empresariales para la experimentación
- Amplia cobertura de documentos: 14,000+ tipos de documentos en 220+ países (los productos de IA son globales desde el primer día)
- Detección de vida real: porque el fraude impulsado por deepfake ya es la norma en 2026
- API limpia: porque las empresas de IA envían semanalmente, no trimestralmente
Esta es la brecha que Didit fue construido para: infraestructura de identificación centralizada a $0.30 por verificación, sin contratos, sin mínimos, 500 comprobaciones gratuitas por mes. Es la forma de verificación de identidad que se adapta a cómo las empresas de IA realmente construyen y escalan.
El Final Del Juego
Dentro de cinco años, registrarse para una cuenta de API con un laboratorio de IA de vanguardia se sentirá como abrir una cuenta de corretaje. Identidad verificada. Comprobaciones de la fuente de fondos para grandes compromisos. Monitoreo continuo. Informes de actividad sospechosa. Re-verificación periódica. Acceso en niveles mapeados a niveles de capacidad.
Esto le parecerá distópico a algunas personas. Sin embargo, es el punto final lógico de dos fuerzas: el asombroso costo del entrenamiento de vanguardia y la asombrosa capacidad de lo que se está entrenando. Cuando lo que está al otro lado de la API pueda mejorar significativamente un programa de armas biológicas o ser destilado en un producto que destruya miles de millones en valor empresarial, la capa de acceso tiene que parecerse a la infraestructura financiera regulada.
Los laboratorios que descubran cómo hacerlo sin romper la experiencia del desarrollador ganarán. Aquellos que se nieguen a verificar (y se destilen a la irrelevancia) o verifiquen mal (y pierdan desarrolladores ante la competencia) no lo harán.
El KYC no es el enemigo de la innovación en la IA. La destilación sin verificar es. Cuanto antes la industria internalice esto, mejor será el equilibrio para todos: los laboratorios, los desarrolladores, los clientes empresariales y los usuarios que dependen de que la capa de IA continúe existiendo.
---
Didit ofrece infraestructura de verificación de identidad construida para productos nativos de IA. Verificación de documentos, vida biométrica, selección de AML, monitoreo continuo: a $0.30 por verificación, en más de 220 países. Comience gratis.
