Блог · 16 апреля 2026 г.

Идентификация в эпоху LLM: Почему Frontier AI Labs нуждаются в проверке личности для выживания (RU)

Обучение передовых моделей стоит сотни миллионов, а их дистилляция – копейки. KYC для доступа к API становится обязательным. Проверка личности – новый барьер для AI-лабораторий.

Автор: Didit16 апреля 2026 г.Обновлено 22 мая 2026 г.

В феврале 2026 года Anthropic опубликовала данные о том, что три китайские AI-лаборатории коллективно провели 16 миллионов запросов к Claude, используя 24 000 мошеннических аккаунтов. Целью было не случайное экспериментирование. Это была дистилляция в промышленном масштабе: обучение более дешевых, менее мощных моделей на основе результатов работы самой дорогой AI-системы, когда-либо созданной.

Через два месяца Anthropic внедрила проверку личности на основе паспорта и селфи для доступа к Claude.

Эта последовательность – не совпадение. Это определяющая история соответствия требованиям в эпоху LLM. Frontier AI быстро и неизбежно оказывается под той же дисциплиной “знай своего клиента, отслеживай своего клиента“, что и банки, брокеры и криптобиржи. В этой статье объясняется, почему, как это выглядит на практике, и что должна делать каждая AI-компания – не только передовые лаборатории.

Экономика, делающая KYC неизбежным

Обучение передовой модели сегодня стоит от 100 миллионов до 1 миллиарда долларов только на вычислительные мощности. GPT-4, Claude 3.5 Opus, Gemini Ultra, Grok 3 — все они находятся в этом диапазоне. Следующее поколение перешагнет порог в 1–10 миллиардов долларов.

Дистилляция стоит примерно 0,1% от этой суммы. Дайте более слабой модели несколько миллионов высококачественных примеров от более сильной, дообучите в течение нескольких недель, и вы восстановите большую часть возможностей целевой модели на большинстве тестов.

Разрыв между “обучением передовой модели” и “дистилляцией передовой модели” составляет три порядка величины. Эта асимметрия — самый важный экономический факт в AI на данный момент. Она объясняет, почему каждая крупная передовая лаборатория либо уже внедряет программу KYC, либо активно разрабатывает ее.

Без KYC атака тривиальна:

Зарегистрируйтесь как можно больше API-аккаунтов в автоматическом режиме
Маршрутизируйте трафик через живые прокси, чтобы обойти ограничения на количество IP-адресов
Используйте сфабрикованные электронные письма, арендованные телефонные номера и предоплаченные карты
Получите несколько миллионов примеров рассуждений по кодированию, математике, использованию инструментов и задачам с агентами
Обучите свою собственную модель на этом наборе данных
Выпустите ее бесплатно или по значительно более низкой цене, чем у оригинала

Общая стоимость атаки для злоумышленника составляет десятки тысяч долларов в виде расходов на API. Коммерческий ущерб для лаборатории, модель которой была дистиллирована, исчисляется миллиардами долларов. Это нестабильная система.

Как выглядит дистилляция на самом деле

Технический отчет Anthropic описал шаблоны атак с необычайной ясностью. Обнаруженные сигналы включают:

Повторяющиеся шаблоны запросов в сотнях скоординированных аккаунтов, предназначенные для получения последовательных цепочек рассуждений
Шаблоны elicitation цепочки мыслей — запросы, которые заставляют модель раскрывать свои полные рассуждения, которые затем используются в качестве данных для обучения.
Трафик, ориентированный на возможности — целые флотилии аккаунтов, фокусирующиеся исключительно на кодировании, использовании агентов-инструментов или математических рассуждениях, в зависимости от целевой возможности
Архитектуры “гидра-кластеров” — сети аккаунтов, распределенных по API и облачным провайдерам, чтобы оставаться ниже порогов аномалий для каждой конечной точки
Коммерческие прокси-сервисы, управляющие десятками тысяч аккаунтов одновременно, смешивая дистилляционный трафик с легитимными рабочими нагрузками для отравления сигнала

Названные участники — DeepSeek, Moonshot AI, MiniMax — несли ответственность за конкретные операции:

MiniMax: 13 миллионов запросов, фокусировались на кодировании агентов и оркестровке инструментов
Moonshot AI: 3,4 миллиона запросов, охватывающих рассуждения агентов, кодирование и компьютерное зрение
DeepSeek: 150 000 запросов, извлечение возможностей рассуждения

Все передовые лаборатории предполагают, что та же атака проводится и против них. Большинство пока не публикуют эти цифры.

Почему именно KYC

Существует много возможных способов защиты от дистилляции. KYC — не единственный из них и сам по себе недостаточен. Однако он является основой, которая позволяет работать всем остальным средствам защиты.

Обнаружение без идентификации — это дырявое сито

Вы можете создать отличные поведенческие классификаторы, которые обнаруживают шаблоны дистилляции. Anthropic так и сделали. Но если злоумышленник может создать 1000 новых аккаунтов в час, ценность вашего классификатора быстро снижается. Каждая заблокированная учетная запись заменяется до того, как вы закончите формулировать причину блокировки.

С подтвержденной личностью каждая заблокированная учетная запись налагает реальную стоимость на злоумышленника — ему нужна новая личность, новый документ, новый биометрический идентификатор. В какой-то момент атака перестанет быть прибыльной.

Правовая защита требует настоящего ответчика

Anthropic может подать в суд на DeepSeek. Она не может подать в суд на “account-98234@tempmail.com”. Нарушения условий обслуживания имеют юридическую силу только в том случае, если вы знаете, кто их совершил. KYC превращает условия обслуживания из символического документа в действующий контракт.

Контроль безопасности рушится без идентификации

Весь каталог развертываний с контролируемыми возможностями — пороговые значения усиления биозащиты, рабочие процессы экспортного контроля, блокировка соответствующих организациям, защита несовершеннолетних — зависит от знания, как минимум, юрисдикции, возраста и правового статуса пользователя. Нельзя фильтровать тех, кого вы не идентифицируете.

Регулирующие органы прибывают

Закон ЕС об AI вступил в силу. Институт безопасности AI в Великобритании имеет прямые соглашения о тестировании с передовыми лабораториями. Исполнительный указ США об AI устанавливает пороговые значения отчетности. Киберпространственное управление Китая уже требует идентификацию личности при использовании генеративного AI. KYC для доступа к AI переходит от передовых практик к нормативным ожиданиям во всех основных юрисдикциях.

Формирующийся план действий для KYC LLM

Форма KYC для AI-платформ быстро сходится к единому стандарту. Основываясь на том, что сейчас делают Anthropic, OpenAI, Google DeepMind и крупные корпоративные AI-облачные провайдеры, стандартная программа выглядит следующим образом.

Уровень 1: Публичный доступ

Бесплатный тариф, продукты для чата потребительского уровня. Подтверждение электронной почты, подтверждение телефона, отпечаток устройства, CAPTCHA. Нет проверки документов, если риск-сигналы не вызывают ее. Цель — отфильтровать очевидные злоупотребления, не разрушая воронку регистрации.

Уровень 2: Доступ к API

Платные клиенты API. Проверка метода оплаты в качестве прокси-идентификатора (KYC на уровне Stripe), плюс некоторые комбинации:

Подтверждение телефона при регистрации
Геолокация IP-адреса и проверка юрисдикции
Проверка домена электронной почты организации для предприятий
Проверка идентификатора, вызванная пороговыми значениями объема, уровнем возможностей или аномальными сигналами

На этом уровне находится текущее развертывание Claude от Anthropic.

Уровень 3: Расширенная проверка благонадежности

Корпоративные контракты, обязательства по массовому выводу, доступ к передовым возможностям (рассуждения в длинном контексте, использование инструментов агентами, кодирование в широком масштабе). Полный стек KYC:

Проверка удостоверения личности, выданного государством, с обнаружением живости
Биометрическое селфи, сопоставленное с фотографией в удостоверении личности
Проверка на наличие в санкционных списках, PEP и негативных новостей
Выявление бенефициарных владельцев для корпоративных клиентов
Проверка источника средств для очень крупных обязательств
Подтверждение предполагаемого использования с договорными ограничениями

Уровень 4: Возможности с высоким риском

Все, что пересекает политику ответственного масштабирования лаборатории или эквивалентный порог — модели усиления биологии, автономные агенты с доступом к записи в реальном мире, возможности двойного использования в киберпространстве. Индивидуальная адаптация с ручной проверкой, проверка государственных клиентов, соблюдение экспортного контроля, периодическая повторная проверка.

Большинство конечных пользователей увидят только уровень 1. Разработчики будут работать на уровне 2. Корпоративные клиенты получат уровень 3. Уровень 4 зарезервирован для небольшого числа утвержденных организаций под прямым правительственным контролем.

Что Frontier Labs делают неправильно

Первые развертывания учатся на ходу, и ошибки показательные.

Бесшумные развертывания разрушают доверие

Anthropic запустила проверку личности в Claude с помощью одной статьи в справочном центре. Без публикации в блоге. Без предварительного уведомления. Без опубликованного объема. Результативная реакция была предсказуема и в значительной степени могла быть предотвращена. Пользователи принимают KYC, когда обоснование ясное, а обработка данных явная. Они восстают, когда проверка появляется внезапно без объяснения.

Неясные триггеры создают паранойю

“Некоторые пользователи, для некоторых функций” — это разумная стратегия развертывания, но ужасная коммуникационная стратегия. Пользователи предполагают худшее — что триггер политический, идеологический или произвольный. Опубликуйте триггеры. “Мы проверяем, когда вы превышаете X запросов в день, когда вы получаете доступ к Y возможностям или когда наши сигналы мошенничества помечают Z-паттерн” — гораздо лучшее сообщение, чем непрозрачные развертывания.

Хранение биометрических данных внутри компании — ошибка

Каждая передовая лаборатория, построившая свой собственный стек проверки личности, пожалеет об этом в течение двух лет. Хранение биометрических данных — это специализированный, регулируемый, протестированный бизнес. Сотрудничайте с выделенным провайдером (Persona, Onfido, Didit) и не занимайтесь хранением данных.

Игнорирование опыта разработчика

Если KYC блокирует вашего API-клиента на два дня, пока рецензент смотрит на расплывчатое сканирование документа, вы потеряли этого клиента. Лучшие процессы проверки завершаются менее чем за 90 секунд на мобильном устройстве с проверкой живости в реальном времени и автоматическим просмотром документов. Все, что медленнее, — это конкурентное преимущество.

Что должен делать каждый AI-продукт, а не только передовые лаборатории

Если вы строите на основе API LLM — чат-бота, платформу агентов, инструмент кодирования, контент-продукт — вы не освобождены от этого изменения. Вы ниже по течению от него.

Три практических рекомендации:

1. Предполагайте, что ваш вышестоящий провайдер потребует больше проверки

Anthropic потребует от своих клиентов API большего. То же самое сделает OpenAI. Если ваша компания не сможет пройти расширенную проверку благонадежности (подтвержденное выявление бенефициарных владельцев, подтверждение предполагаемого использования, проверка экспортного контроля), доступ к вашему API может быть поставлен под угрозу. Приведите в порядок корпоративную позицию KYC сейчас, прежде чем это станет чрезвычайной ситуацией.

2. Внедрите KYC, основанный на рисках, для своих собственных пользователей

Ваш продукт, вероятно, злоупотребляется с той же скоростью, что и передовые лаборатории. Спам-агенты, сети скрапинга, боты, выдающие себя за других, мошеннические кольца. Правильная архитектура:

Низкий порог входа при регистрации — Email, телефон, отпечаток устройства
Проверка, инициированная сигналом риска — объем, аномалии, подозрительные шаблоны, конфиденциальные функции
Улучшенная проверка для платных тарифных планов — документ + живость + проверка санкций
Непрерывный мониторинг — поведенческие отпечатки пальцев, повторная проверка при аномалиях

Это та же модель KYC, основанная на рисках, которую банки используют десятилетиями, адаптированная для продуктов AI.

3. Выберите поставщика идентификационной информации, который подходит для рабочих процессов AI

Наследованные поставщики KYC были созданы для банков. Они медленные, дорогие и оптимизированы для неправильных показателей. Продуктам AI необходимо:

Быстрая проверка — менее 90 секунд от начала и до конца
Ценообразование на основе использования — без минимальных сумм, без корпоративных контрактов для экспериментов
Широкое покрытие документов — более 14 000 типов документов в 220+ странах (AI-продукты глобальны с первого дня)
Реальное обнаружение живости — потому что мошенничество, основанное на deepfake, уже является нормой в 2026 году
Чистый API — потому что AI-компании выпускают обновления еженедельно, а не ежеквартально

В этом Didit была создана для: основная KYC за 0,30 доллара США за проверку, без контрактов, без минимумов, 500 бесплатных проверок в месяц. Это форма проверки личности, которая соответствует тому, как AI-компании фактически создают и масштабируются.

Конечная игра

Через пять лет регистрация учетной записи API у передовой AI-лаборатории будет похожа на открытие брокерского счета. Проверенная личность. Проверка источника средств для крупных обязательств. Постоянный мониторинг. Сообщение о подозрительной деятельности. Периодическая повторная проверка. Уровни доступа, сопоставленные с уровнями возможностей.

Некоторым это покажется антиутопией. Однако это логический итог двух сил: ошеломляющей стоимости передового обучения и ошеломляющих возможностей того, что обучается. Когда сущность на другой стороне API может значительно расширить биологическую программу вооружений или быть дистиллирована в продукт, который уничтожит миллиарды долларов в корпоративной стоимости, уровень доступа должен выглядеть как регулируемая финансовая инфраструктура.

Лаборатории, которые выяснят, как сделать это без нарушения опыта разработчиков, выиграют. Те, которые либо откажутся от проверки (и станут неактуальными за счет дистилляции), либо проверят плохо (и потеряют разработчиков в пользу конкурентов), не выиграют.

KYC — не враг инноваций в AI. Неконтролируемая дистилляция — вот враг. Чем скорее отрасль это усвоит, тем лучше будет равновесие для всех — лабораторий, разработчиков, корпоративных клиентов и пользователей, которые зависят от того, что AI-слой будет продолжать существовать.

---

Didit предоставляет инфраструктуру проверки личности, созданную для AI-родных продуктов. Проверка документов, биометрическая живость, проверка AML, постоянный мониторинг — по 0,30 доллара США за проверку, в 220+ странах. Начните бесплатно.

Продолжить чтение