ब्लॉग · 16 अप्रैल 2026

एलएलएम के युग में केवायसी: क्यों फ्रंटियर एआई लैब्स को जीवित रहने के लिए पहचान सत्यापन की आवश्यकता है (HI-1)

फ्रंटियर मॉडलों को प्रशिक्षित करने में लाखों डॉलर खर्च होते हैं और उन्हें कुछ पैसे में डिस्टिल किया जा सकता है। एपीआई एक्सेस पर केवायसी अनिवार्य होता जा रहा है। यहाँ बताया गया है कि पहचान सत्यापन एआई लैब्स के लिए नई खाई क्यों है।.

द्वारा Didit16 अप्रैल 2026अपडेट किया गया 22 मई 2026

फ़रवरी 2026 में, एंथ्रोपिक ने सबूत प्रकाशित किए कि तीन चीनी एआई लैब्स ने सामूहिक रूप से 16 मिलियन आदान-प्रदान क्लाउड के साथ 24,000 धोखाधड़ी खातों का उपयोग करके किए थे। उद्देश्य आकस्मिक प्रयोग नहीं था। यह औद्योगिक पैमाने पर डिस्टिलेशन था: सबसे महंगे एआई सिस्टम के आउटपुट पर सस्ते, कमजोर मॉडल को प्रशिक्षित करना।

दो महीने बाद, एंथ्रोपिक ने क्लाउड पर पासपोर्ट-और-सेल्फी पहचान सत्यापन रोल आउट किया।

यह क्रम संयोग नहीं है। यह एलएलएम युग की परिभाषित अनुपालन कहानी है। फ्रंटियर एआई को बैंकों, ब्रोकरों और क्रिप्टो एक्सचेंजों के तहत रहने वाले समान "अपने ग्राहक को जानें, अपने ग्राहक की निगरानी करें" अनुशासन में जल्दी और अपरिहार्य रूप से खींचा जा रहा है। इस पोस्ट में बताया गया है कि क्यों, यह व्यवहार में कैसा दिखता है, और प्रत्येक एआई कंपनी - केवल फ्रंटियर लैब्स ही नहीं - को इसके बारे में क्या करना चाहिए।

आर्थिक कारण जो केवायसी को अनिवार्य बनाते हैं

आज एक फ्रंटियर मॉडल को प्रशिक्षित करने में केवल कंप्यूटिंग में 100 मिलियन और 1 बिलियन डॉलर खर्च होते हैं। जीपीटी-4, क्लाउड 3.5 ओपस, जेमिनी अल्ट्रा, ग्रोक 3 - सभी उस सीमा में हैं। अगली पीढ़ी 1 से 10 बिलियन डॉलर के ब्रैकेट में प्रवेश करेगी।

डिस्टिलेशन की लागत मोटे तौर पर उसका 0.1% है। एक मजबूत मॉडल से कुछ मिलियन उच्च-गुणवत्ता वाले उदाहरणों को एक कमजोर मॉडल को दें, कुछ हफ्तों के लिए फाइन-ट्यून करें, और आपने अधिकांश बेंचमार्क पर लक्ष्य मॉडल की क्षमता का एक बड़ा अंश प्राप्त कर लिया है।

"एक फ्रंटियर मॉडल को प्रशिक्षित करें" और "एक फ्रंटियर मॉडल को डिस्टिल करें" के बीच का अंतर तीन परिमाण का क्रम है। यह विषमता अभी एआई में सबसे महत्वपूर्ण आर्थिक तथ्य है। यह बताता है कि क्यों प्रत्येक प्रमुख फ्रंटियर लैब या तो पहले से ही एक केवायसी कार्यक्रम चला रही है या उसके पास एक सक्रिय विकास में है।

केवायसी के बिना, हमला तुच्छ है:

जितने एपीआई खाते आप स्वचालित कर सकते हैं, उनके लिए साइन अप करें
आईपी दर सीमाओं को हराने के लिए आवासीय प्रॉक्सी के माध्यम से ट्रैफ़िक रूट करें
गढ़े हुए ईमेल, किराए पर लिए गए फ़ोन नंबर और प्रीपेड कार्ड का उपयोग करें
कोडिंग, गणित, टूल उपयोग और एजेंटिक कार्यों में कुछ मिलियन रीजनिंग ट्रेस खींचें
अपने मॉडल को डेटासेट पर प्रशिक्षित करें
इसे मुफ्त में या मूल कीमत के एक अंश के लिए जारी करें

हमलावर के लिए कुल बिल एपीआई खर्च में दसियों हज़ार डॉलर है। डिस्टिल्ड मॉडल की वाणिज्यिक क्षति अरबों में है। यह एक स्थिर प्रणाली नहीं है।

डिस्टिलेशन वास्तव में कैसा दिखता है

एंथ्रोपिक के तकनीकी लेख में हमले के पैटर्न को असामान्य स्पष्टता के साथ वर्णित किया गया है। उन्होंने जो हस्ताक्षर पाए उनमें शामिल हैं:

दोहराव वाले प्रॉम्प्ट टेम्पलेट सैकड़ों समन्वित खातों में, लगातार तर्क श्रृंखलाओं को प्राप्त करने के लिए डिज़ाइन किए गए
चेन-ऑफ-थॉट इलिसिटेशन पैटर्न - प्रॉम्प्ट जो मॉडल को अपने पूरे तर्क को उजागर करने के लिए मजबूर करते हैं, जिसे प्रशिक्षण डेटा के रूप में स्क्रैप किया जाता है
क्षमता-लक्षित ट्रैफ़िक - खातों का पूरा बेड़ा विशेष रूप से कोडिंग, एजेंटिक टूल उपयोग या गणितीय तर्क पर केंद्रित है, जो लक्ष्य क्षमता पर निर्भर करता है
"हाइड्रा क्लस्टर" आर्किटेक्चर - एपीआई और क्लाउड प्रदाताओं में वितरित खातों के नेटवर्क ताकि प्रति-एंडपॉइंट विसंगति थ्रेसहोल्ड के तहत रहें
व्यावसायिक प्रॉक्सी सेवाएं एक साथ दसियों हज़ार खातों का प्रबंधन करती हैं, वैध वर्कलोड के साथ डिस्टिलेशन ट्रैफ़िक को मिलाकर सिग्नल को खराब करती हैं

नाम वाले अभिनेता - डीपसीक, मूनशॉट एआई, मिनीमैक्स - विशिष्ट कार्यों के लिए जिम्मेदार थे:

मिनीमैक्स: 13 मिलियन आदान-प्रदान, एजेंटिक कोडिंग और टूल ऑर्केस्ट्रेशन पर केंद्रित
मूनशॉट एआई: 3.4 मिलियन आदान-प्रदान, एजेंटिक तर्क, कोडिंग और कंप्यूटर विज़न को कवर करते हुए
डीपसीक: 150,000 आदान-प्रदान, तर्क क्षमताओं को निकालना

हर फ्रंटियर लैब मानती है कि उसी हमले को उन पर चलाया जा रहा है। उनमें से अधिकांश अभी संख्याएँ प्रकाशित नहीं कर रहे हैं।

विशेष रूप से केवायसी क्यों

डिस्टिलेशन के खिलाफ कई संभावित बचाव हैं। केवायसी उनमें से एक नहीं है, और यह अपने आप में पर्याप्त नहीं है। हालाँकि, यह मूलभूत परत है जो हर अन्य बचाव को काम करती है।

पहचान के बिना पहचान एक लीक छलनी है

आप उत्कृष्ट व्यवहार वर्गीकरणकर्ता बना सकते हैं जो डिस्टिलेशन पैटर्न का पता लगाते हैं। एंथ्रोपिक ने किया। लेकिन अगर हमलावर एक घंटे में 1,000 नए खाते स्पिन कर सकता है, तो आपके वर्गीकरणकर्ता का मूल्य तेजी से कम हो जाता है। हर प्रतिबंधित खाते को बदलने से पहले आप प्रतिबंध के तर्क को लिखना समाप्त कर देते हैं।

सत्यापित पहचान के साथ, प्रत्येक प्रतिबंधित खाता हमलावर पर एक वास्तविक लागत लगाता है - उन्हें एक नई पहचान, एक नया दस्तावेज़, एक नया बायोमेट्रिक की आवश्यकता होती है। एक निश्चित मूल्य बिंदु पर, हमला लाभदायक होना बंद हो जाता है।

कानूनी सहारा के लिए एक वास्तविक प्रतिवादी की आवश्यकता होती है

एंथ्रोपिक डीपसीक पर मुकदमा कर सकता है। यह "account-98234@tempmail.com" पर मुकदमा नहीं कर सकता है। सेवा की शर्तों का उल्लंघन केवल तभी लागू किया जा सकता है जब आप जानें कि उनका उल्लंघन किसने किया है। केवायसी सेवा की शर्तों को एक प्रतीकात्मक दस्तावेज़ से एक कार्रवाई योग्य अनुबंध में बदल देता है।

सुरक्षा नियंत्रण पहचान के बिना ढह जाते हैं

क्षमता-गेटेड परिनियोजन की पूरी सूची - बायोसेक्योरिटी अपलिफ्ट थ्रेसहोल्ड, निर्यात-नियंत्रण वर्कफ़्लो, प्रतिबंधित-इकाई अवरोधन, नाबालिग सुरक्षा - कम से कम उपयोगकर्ता के अधिकार क्षेत्र, आयु और कानूनी स्थिति को जानने पर निर्भर करती है। आप उन लोगों को फ़िल्टर नहीं कर सकते जिन्हें आप पहचान नहीं करते हैं।

नियामक आ रहे हैं

ईयू एआई अधिनियम लागू है। यूके एआई सुरक्षा संस्थान के पास फ्रंटियर लैब्स के साथ प्रत्यक्ष परीक्षण समझौते हैं। एआई पर यूएस कार्यकारी आदेश रिपोर्टिंग थ्रेसहोल्ड निर्धारित करता है। साइबरस्पेस प्रशासन ऑफ़ चाइना पहले से ही जेनरेटिव एआई पर पहचान सत्यापन की आवश्यकता है। एआई एक्सेस पर केवायसी सर्वोत्तम अभ्यास से लेकर नियामक अपेक्षा तक हर प्रमुख अधिकार क्षेत्र में आगे बढ़ रहा है।

एलएलएम केवायसी के लिए उभरता हुआ प्लेबुक

एआई प्लेटफॉर्म के लिए केवायसी का आकार तेजी से अभिसरण कर रहा है। एंथ्रोपिक, ओपनएआई, गूगल डीपमाइंड और बड़े एंटरप्राइज एआई क्लाउड प्रदाताओं के अब जो कर रहे हैं, उसके आधार पर, मानक कार्यक्रम इस तरह दिखता है।

स्तर 1: सार्वजनिक एक्सेस

मुफ्त स्तर, उपभोक्ता चैट उत्पाद। ईमेल सत्यापन, फ़ोन सत्यापन, डिवाइस फ़िंगरप्रिंटिंग, कैप्चा। यदि जोखिम संकेत इसे ट्रिगर करते हैं तो कोई दस्तावेज़ सत्यापन नहीं। लक्ष्य साइनअप फ़नल को नष्ट किए बिना स्पष्ट दुरुपयोग को फ़िल्टर करना है।

स्तर 2: एपीआई एक्सेस

भुगतान किए गए एपीआई ग्राहक। प्रॉक्सी पहचान के रूप में भुगतान विधि सत्यापन (स्ट्राइप-स्तरीय केवायसी), साथ ही:

साइनअप पर फ़ोन सत्यापन
आईपी भू-स्थान और अधिकार क्षेत्र स्क्रीनिंग
उद्यम के लिए संगठन ईमेल डोमेन सत्यापन
मात्रा थ्रेसहोल्ड, क्षमता स्तर या विसंगति संकेतों द्वारा ट्रिगर किया गया आईडी सत्यापन

यह एंथ्रोपिक के वर्तमान क्लाउड रोलआउट के पास है।

स्तर 3: बढ़ी हुई उचित परिश्रम

उद्यम अनुबंध, थोक अनुमान प्रतिबद्धताएं, फ्रंटियर क्षमताओं (लंबा-संदर्भ तर्क, एजेंटिक टूल उपयोग, पैमाने पर कोडिंग) तक पहुंच। पूर्ण केवायसी स्टैक:

लिवनेस डिटेक्शन के साथ जारी किए गए सरकारी आईडी सत्यापन
आईडी फोटो से मिलान किया गया बायोमेट्रिक सेल्फी
प्रतिबंध, पीईपी और प्रतिकूल मीडिया स्क्रीनिंग
कॉर्पोरेट ग्राहकों के लिए लाभकारी स्वामित्व
बहुत बड़ी प्रतिबद्धताओं के लिए निधियों का स्रोत
अनुबंध प्रतिबंधों के साथ इच्छित-उपयोग की पुष्टि

स्तर 4: उच्च जोखिम क्षमताएं

कुछ भी जो लैब की जिम्मेदार स्केलिंग नीति या समकक्ष थ्रेसहोल्ड को पार करता है - जीव-अपलिफ्ट मॉडल, वास्तविक दुनिया की लेखन पहुंच वाले स्वायत्त एजेंट, दोहरे-उपयोग साइबर क्षमताएं। मैनुअल समीक्षा, सरकारी ग्राहक सत्यापन, निर्यात-नियंत्रण अनुपालन, आवधिक पुन: सत्यापन के साथ कस्टम ऑनबोर्डिंग।

अधिकांश एंड-यूज़र केवल स्तर 1 देखेंगे। बिल्डर स्तर 2 में रहेंगे। एंटरप्राइज़ ग्राहक स्तर 3 का अनुभव करेंगे। स्तर 4 कुछ अनुमोदित संस्थाओं के लिए आरक्षित है जो प्रत्यक्ष सरकारी निरीक्षण के तहत हैं।

फ्रंटियर लैब्स क्या गलत कर रही हैं

प्रारंभिक रोलआउट सीख रहे हैं, और गलतियाँ शिक्षाप्रद हैं।

मौन रोलआउट विश्वास को नष्ट कर देते हैं

एंथ्रोपिक ने क्लाउड पर पहचान सत्यापन एक एकल सहायता केंद्र लेख के साथ लॉन्च किया। कोई ब्लॉग पोस्ट नहीं। कोई पूर्व सूचना नहीं। कोई प्रकाशित दायरा नहीं। परिणामी प्रतिक्रिया पूर्वानुमानित और काफी हद तक टाली जा सकती थी। उपयोगकर्ता केवायसी को स्वीकार करते हैं जब तर्क स्पष्ट होता है और डेटा हैंडलिंग स्पष्ट होती है। वे तब विद्रोह करते हैं जब सत्यापन बिना किसी स्पष्टीकरण के रातोंरात प्रकट होता है।

अस्पष्ट ट्रिगर व्यामोह पैदा करते हैं

"कुछ उपयोगकर्ताओं के लिए, कुछ सुविधाओं के लिए" एक उचित रोलआउट रणनीति है लेकिन एक भयानक संचार रणनीति है। उपयोगकर्ता सबसे खराब मान लेते हैं - कि ट्रिगर राजनीतिक, वैचारिक या मनमाना है। ट्रिगर प्रकाशित करें। "जब आप X अनुरोध/दिन से अधिक हो जाते हैं, तो जब आप Y क्षमता तक पहुंचते हैं, या जब हमारे धोखाधड़ी संकेत Z पैटर्न को ध्वजांकित करते हैं" एक अस्पष्ट रोलआउट की तुलना में एक बहुत बेहतर संदेश है।

बायोमेट्रिक डेटा को इन-हाउस रखना एक गलती है

हर फ्रंटियर लैब जिसने अपना खुद का पहचान सत्यापन स्टैक बनाया है, उसे दो साल के भीतर इसका पछतावा होगा। बायोमेट्रिक हिरासत एक विशिष्ट, विनियमित, ऑडिट किया जाने वाला व्यवसाय है। एक समर्पित प्रदाता (पर्सोना, ऑनफिडो, डिडिट) के साथ भागीदारी करें और डेटा हिरासत के व्यवसाय से बाहर रहें। एंथ्रोपिक ने इस हिस्से को सही किया।

डेवलपर अनुभव को अनदेखा करना

यदि केवायसी एक डेवलपर के लिए एक धुंधले दस्तावेज़ स्कैन को देखने के लिए दो दिनों के लिए आपके एपीआई को अवरुद्ध करता है, तो आपने उस ग्राहक को खो दिया है। सबसे अच्छी सत्यापन प्रवाह 90 सेकंड से कम समय में मोबाइल डिवाइस पर रीयल-टाइम लिवनेस जांच और स्वचालित दस्तावेज़ समीक्षा के साथ पूरी हो जाती है। कुछ धीमा प्रतिस्पर्धी नुकसान है।

हर एआई उत्पाद को क्या करना चाहिए, न कि केवल फ्रंटियर लैब्स

यदि आप एक एलएलएम एपीआई पर निर्माण कर रहे हैं - एक चैटबॉट, एक एजेंट प्लेटफॉर्म, एक कोडिंग टूल, एक सामग्री उत्पाद - तो आप इस बदलाव से छूट प्राप्त नहीं हैं। आप इसके डाउनस्ट्रीम हैं।

तीन व्यावहारिक सिफारिशें:

1. मान लें कि आपका अपस्ट्रीम प्रदाता अधिक सत्यापन की आवश्यकता होगी

एंथ्रोपिक अपने एपीआई ग्राहकों से समय के साथ और अधिक पूछेगा। इसलिए ओपनएआई भी करेगा। यदि आपकी कंपनी बढ़ी हुई उचित परिश्रम को पास नहीं कर सकती है (सत्यापित लाभकारी स्वामित्व, इच्छित उपयोग की पुष्टि, निर्यात-नियंत्रण स्क्रीनिंग), तो आपकी एपीआई एक्सेस जोखिम में है। अपने कॉर्पोरेट केवायसी रुख को अभी साफ करें, इससे पहले कि यह एक आपात स्थिति बन जाए।

2. अपने स्वयं के उपयोगकर्ताओं पर जोखिम-आधारित केवायसी लागू करें

आपका उत्पाद फ्रंटियर लैब्स के समान दरों पर दुरुपयोग किया जा रहा है। स्पैम एजेंट, स्क्रैपिंग नेटवर्क, प्रतिरूपण बॉट, धोखाधड़ी के छल्ले। सही वास्तुकला:

साइनअप पर कम घर्षण - ईमेल, फ़ोन, डिवाइस फ़िंगरप्रिंटिंग
जोखिम संकेतों द्वारा ट्रिगर किया गया सत्यापन - मात्रा, विसंगति, संदिग्ध पैटर्न, संवेदनशील सुविधाएँ
भुगतान किए गए स्तरों के लिए बढ़ाया गया सत्यापन - दस्तावेज़ + लाइवनेस + प्रतिबंध स्क्रीनिंग
लगातार निगरानी - व्यवहार संबंधी फ़िंगरप्रिंट, विसंगतियों पर पुन: सत्यापन

यह वही जोखिम-आधारित मॉडल है जिसका उपयोग बैंकों ने दशकों से किया है, जिसे एआई उत्पादों के लिए अनुकूलित किया गया है।

3. एक पहचान प्रदाता चुनें जो एआई वर्कफ़्लो के अनुकूल हो

विरासत केवायसी विक्रेता बैंकों के लिए बनाए गए थे। वे धीमे, महंगे हैं और गलत मीट्रिक के लिए अनुकूलित हैं। एआई उत्पादों को इसकी आवश्यकता है:

तेजी से सत्यापन - एंड-टू-एंड के तहत 90 सेकंड
उपयोग-आधारित मूल्य निर्धारण - कोई न्यूनतम नहीं, प्रयोग के लिए कोई उद्यम अनुबंध नहीं
व्यापक दस्तावेज़ कवरेज - 14,000+ दस्तावेज़ प्रकार 220+ देशों में (एआई उत्पाद दिन एक से वैश्विक हैं)
वास्तविक लाइवनेस डिटेक्शन - क्योंकि डीपफेक-संचालित धोखाधड़ी पहले से ही 2026 में सामान्य है
साफ एपीआई - क्योंकि एआई कंपनियां त्रैमासिक रूप से नहीं, साप्ताहिक रूप से शिप करती हैं

यही अंतर डिडिट के लिए बनाया गया था: एआई-देशी उत्पादों के लिए बनाया गया पहचान सत्यापन बुनियादी ढांचा। दस्तावेज़ सत्यापन, बायोमेट्रिक लाइवनेस, एएमएल स्क्रीनिंग, चल रही निगरानी - $0.30 प्रति जांच पर, कोई अनुबंध नहीं, कोई न्यूनतम नहीं, 500 मुफ्त जांच प्रति माह। यह वह पहचान सत्यापन का आकार है जो एआई कंपनियां वास्तव में कैसे निर्माण और स्केल करती हैं।

एंडगेम

पांच साल में, फ्रंटियर एआई लैब के साथ एपीआई खाते के लिए साइन अप करना ब्रोकरेज खाता खोलने जैसा महसूस होगा। सत्यापित पहचान। बड़े प्रतिबद्धताओं के लिए निधियों का स्रोत। चल रही निगरानी। संदिग्ध गतिविधि रिपोर्टिंग। आवधिक पुन: सत्यापन।

यह कुछ लोगों को डिस्टोपियन लग सकता है। हालाँकि, यह दो ताकतों का तार्किक अंत बिंदु है: फ्रंटियर प्रशिक्षण की चौंका देने वाली लागत, और प्रशिक्षित किए जा रहे की चौंका देने वाली क्षमता। जब एपीआई के दूसरी तरफ की चीज़ एक जैव-हथियार कार्यक्रम को महत्वपूर्ण रूप से बढ़ा सकती है, या एक ऐसे उत्पाद में डिस्टिल की जा सकती है जो उद्यम मूल्य में अरबों डॉलर को नष्ट कर देती है, तो एक्सेस लेयर को विनियमित वित्तीय बुनियादी ढांचे जैसा दिखना होगा।

जिन लैब्स को यह पता लगाने का तरीका पता चलता है कि वे डेवलपर अनुभव को तोड़े बिना ऐसा कैसे करें, वे जीतेंगे। जो या तो सत्यापित करने से इनकार करते हैं (और अप्रासंगिकता में डिस्टिल हो जाते हैं) या खराब रूप से सत्यापित करते हैं (और प्रतिस्पर्धियों को डेवलपर्स खो देते हैं) वे नहीं करेंगे।

केवायसी एआई में नवाचार का दुश्मन नहीं है। अनियंत्रित डिस्टिलेशन है। उद्योग जितना जल्द इस बात को आत्मसात करता है, उतना ही बेहतर संतुलन सभी के लिए दिखता है - लैब्स, डेवलपर्स, एंटरप्राइज़ ग्राहक और वे उपयोगकर्ता जो एआई लेयर के अस्तित्व में रहने पर निर्भर हैं।

---

डिडिट एआई-देशी उत्पादों के लिए बनाया गया पहचान सत्यापन बुनियादी ढांचा प्रदान करता है। दस्तावेज़ सत्यापन, बायोमेट्रिक लाइवनेस, एएमएल स्क्रीनिंग, चल रही निगरानी - $0.30 प्रति जांच पर, 220+ देशों में। मुफ्त में शुरू करें।