डिडिट का दो-स्कोर AML मॉडल: मैच स्कोर बनाम रिस्क स्कोर (HI)
डिडिट का AML इंजन दो सवालों का अलग-अलग जवाब देता है — क्या यह हिट वास्तव में आपका ग्राहक है (मैच स्कोर), और वे कितने जोखिम भरे हैं (रिस्क स्कोर)। यहां बताया गया है कि प्रत्येक स्कोर को कैसे भारित किया जाता है, सीमा निर्धारित की.

अधिकांश AML स्क्रीनिंग टूल दो पूरी तरह से अलग-अलग सवालों को एक ही संख्या में समेट देते हैं। क्या यह वॉचलिस्ट हिट वास्तव में मेरा ग्राहक है? और यह ग्राहक कितना खतरनाक है? को एक 'जोखिम स्कोर' में मिला दिया जाता है, और इसका परिणाम उन नामों से भरा एक कतार होता है जो वास्तविक प्रतिबंधों से मेल खाते हैं, जो उन पर काम करने वाले विश्लेषक को एक जैसे लगते हैं।
डिडिट का AML स्क्रीनिंग इंजन यह गलती करने से इनकार करता है। यह एक दो-स्कोर मॉडल चलाता है: एक मैच स्कोर जो पहचान के विश्वास को मापता है, और एक रिस्क स्कोर जो इकाई के जोखिम को मापता है। इनकी गणना और सीमा निर्धारण स्वतंत्र रूप से किया जाता है, जो वास्तविक हिट्स को छोड़े बिना झूठी सकारात्मकता को कम करने के लिए आपके पास सबसे बड़ा लीवर है। यह पोस्ट ठीक से बताती है कि प्रत्येक स्कोर कैसे काम करता है।
मुख्य बातें
- मैच स्कोर (0–100) यह बताता है कि क्या यह वास्तव में वही व्यक्ति है? — नाम की समानता, जन्म तिथि और देश, भारित और विन्यास योग्य।
- रिस्क स्कोर (0–100) यह बताता है कि एक पुष्ट इकाई कितनी जोखिम भरी है? — श्रेणी, देश का जोखिम और आपराधिक रिकॉर्ड।
- दोनों स्वतंत्र हैं। एक कम जोखिम वाले रिकॉर्ड से पूरी तरह मेल खाने वाला नाम और एक प्रतिबंधित इकाई से कमजोर मेल को अलग-अलग स्थितियों के रूप में माना जाता है।
- विन्यास योग्य भार और सीमाएं आपको अपनी जोखिम क्षमता के अनुसार समायोजित करने देती हैं; मैच के भार का योग 100 होना चाहिए।
- एक दस्तावेज़-संख्या का मिलान 'गोल्डन की' है — यह मैच स्कोर को 100% तक अधिलेखित कर देता है।
- दोनों स्कोर स्टैंडअलोन
POST /v3/aml/कॉल और डिडिट सत्यापन वर्कफ़्लो के अंदर, प्रति जांच $0.20 पर उपलब्ध हैं।
दो स्कोर क्या हैं
जब आप किसी विषय की स्क्रीनिंग करते हैं, तो इंजन हर वॉचलिस्ट प्रोफ़ाइल को सामने लाता है जो संभावित रूप से मेल खाती है। प्रत्येक के लिए यह दो चीजें गणना करता है।
मैच स्कोर पहचान के बारे में है। दिए गए नाम, जन्म तिथि और देश के आधार पर जो आपने सबमिट किया है, इंजन को कितना विश्वास है कि यह वॉचलिस्ट रिकॉर्ड उसी व्यक्ति का वर्णन करता है? 96 का स्कोर का मतलब है 'लगभग निश्चित रूप से वही व्यक्ति'; 40 का स्कोर का मतलब है 'नाम साझा करता है, शायद एक संयोग है।'
रिस्क स्कोर स्वयं इकाई के बारे में है, यह मानते हुए कि मिलान वास्तविक है। एक उच्च जोखिम वाले क्षेत्राधिकार में प्रतिकूल मीडिया वाला एक पुष्ट PEP उच्च स्कोर करता है; एक पुष्ट लेकिन मामूली नियामक-पंजीकरण प्रविष्टि कम स्कोर करती है। रिस्क स्कोर कभी नहीं पूछता कि मिलान सही है या नहीं — यह मैच स्कोर का काम है — यह पूछता है कि यदि ऐसा है तो आपको कितनी चिंता करनी चाहिए।
यह क्यों मायने रखता है
इस अलगाव का महत्व परिचालन है, और यह सीधे विश्लेषक के कार्यभार में दिखाई देता है। कल्पना कीजिए कि 'मारिया गोंजालेज' नामक एक ग्राहक की स्क्रीनिंग की जा रही है। 1,300+ सूचियों में उस नाम के कई लोग होंगे, जिनमें से कुछ वास्तविक जोखिम वाले होंगे। यदि आपके पास एक मिश्रित स्कोर है, तो वे सभी रिकॉर्ड समान रूप से महत्वपूर्ण दिखते हुए समीक्षा में आते हैं, और आपके विश्लेषक नामों को खारिज करने में घंटों खर्च करते हैं।
दो स्कोर के साथ, इंजन कमजोर पहचान मिलानों को False Positive के रूप में चुपचाप चिह्नित कर सकता है इससे पहले कि वे कभी किसी इंसान तक पहुंचें, भले ही वे रिकॉर्ड कितने भी जोखिम भरे क्यों न हों — क्योंकि यदि वह आपका ग्राहक नहीं है, तो जोखिम अप्रासंगिक है। केवल वे रिकॉर्ड जो पहचान की बाधा को पार करते हैं, जोखिम के लिए मूल्यांकन किए जाते हैं और समीक्षा के लिए रूट किए जाते हैं। इसका परिणाम एक छोटी, प्रासंगिक और बचाव योग्य समीक्षा कतार है।
तकनीकी विवरण
दोनों स्कोर उसी /v3/aml/ प्रतिक्रिया पर वापस आते हैं। स्टैंडअलोन कॉल:
curl -X POST https://verification.didit.me/v3/aml/ \
-H "x-api-key: $DIDIT_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"first_name": "Maria",
"last_name": "Gonzalez",
"date_of_birth": "1984-03-12",
"country": "ES",
"document_number": "X1234567Z"
}'
प्रत्येक सामने आई प्रोफ़ाइल अपना स्वयं का मैच स्कोर और समीक्षा स्थिति रखती है; स्क्रीनिंग समग्र रूप से रिस्क स्कोर और समग्र स्थिति रखती है:
{
"aml_status": "In Review",
"risk_score": 71,
"matches": [
{ "profile_id": "prf_5a91c2", "match_score": 96, "match_status": "Unreviewed", "categories": ["PEP 2"] },
{ "profile_id": "prf_77b0e1", "match_score": 48, "match_status": "False Positive", "categories": ["Adverse Media"] }
]
}
मैच स्कोर कैसे बनाया जाता है
मैच स्कोर पहचान संकेतों का एक भारित मिश्रण है। डिफ़ॉल्ट:
| संकेत | डिफ़ॉल्ट भार |
|---|---|
| नाम की समानता | 60% |
| जन्म की तारीख | 25% |
| देश | 15% |
भार विन्यास योग्य हैं और इनका योग 100 होना चाहिए — यदि आप नाम की समानता बढ़ाते हैं, तो आप कुछ और कम करते हैं। डिफ़ॉल्ट निर्णय सीमा 93 है: 93 से नीचे स्कोर करने वाली प्रोफ़ाइल को स्वतः ही False Positive पर सेट कर दिया जाता है; 93 या उससे ऊपर स्कोर करने वाली प्रोफ़ाइल Unreviewed हो जाती है और एक विश्लेषक की प्रतीक्षा करती है।
गोल्डन की। यदि आप एक document_number पास करते हैं और यह वॉचलिस्ट रिकॉर्ड से मेल खाता है, तो मैच स्कोर को सीधे 100% पर अधिलेखित कर दिया जाता है। एक दस्तावेज़-संख्या का मिलान सबसे मजबूत संभव पहचान संकेत है, इसलिए यह भारित मिश्रण को शॉर्ट-सर्किट करता है — इस बारे में कोई अस्पष्टता नहीं है कि क्या यह वही व्यक्ति है।
रिस्क स्कोर कैसे बनाया जाता है
रिस्क स्कोर जोखिम संकेतों का एक भारित मिश्रण है। डिफ़ॉल्ट:
| संकेत | डिफ़ॉल्ट भार |
|---|---|
| श्रेणी (प्रतिबंध, PEP स्तर, प्रतिकूल मीडिया, आदि) | 50% |
| देश का जोखिम | 30% |
| आपराधिक रिकॉर्ड | 20% |
यह दो सीमाओं के माध्यम से समग्र AML स्थिति को संचालित करता है। डिफ़ॉल्ट रूप से अनुमोदन सीमा 80 है और समीक्षा सीमा 100 है:
| रिस्क स्कोर | स्थिति |
|---|---|
| 80 से नीचे | अनुमोदित |
| 80 से 100 | समीक्षा में |
| 100 से ऊपर | अस्वीकृत |
मूल्य। प्रति जांच $0.20 — दो-स्कोर मूल्यांकन शामिल है, यह एक ऐड-ऑन नहीं है।
एक विश्लेषक जिन समीक्षा स्थितियों पर काम करता है
एक बार जब एक प्रोफ़ाइल सामने आती है, तो यह समीक्षा स्थितियों के एक छोटे, ऑडिट योग्य सेट से गुजरती है:
- झूठी सकारात्मकता (False Positive) — आपका ग्राहक नहीं (अक्सर स्वचालित रूप से सेट किया जाता है जब मैच स्कोर सीमा से नीचे होता है)।
- अनालोचित (Unreviewed) — मैच सीमा को पार कर गया, मानवीय निर्णय की प्रतीक्षा कर रहा है।
- पुष्टि मिलान (Confirmed Match) — एक विश्लेषक ने सत्यापित किया कि यह आपका ग्राहक है।
- अनिर्णायक (Inconclusive) — सबूत वास्तव में अस्पष्ट हैं और मामले को रोक दिया गया है।
यह पेपर ट्रेल है। जब एक नियामक पूछता है कि आपने किसी ऐसे व्यक्ति को क्यों शामिल किया जिसका नाम एक प्रतिबंधित व्यक्ति के साथ साझा किया गया था, तो 'मैच स्कोर 41 था, हमारी 93 की सीमा से नीचे था, स्वतः ही झूठी सकारात्मकता के रूप में वर्गीकृत किया गया था' एक पूर्ण, बचाव योग्य उत्तर है।
उपयोग के मामले
- फिनटेक। कम-आत्मविश्वास वाले मिलानों को स्वचालित रूप से दबाकर ऑनबोर्डिंग को तेज़ रखें, जबकि उच्च-जोखिम वाले मिलानों को कभी भी कम-स्क्रीनिंग न करें।
- क्रिप्टो / वेब3। उच्च-आश्वासन वाले KYC प्रवाह के लिए दस्तावेज़-संख्या गोल्डन की का उपयोग करें ताकि पुष्ट पहचान नाम के अनुमान को छोड़ दें।
- ऋण। उधारकर्ताओं और गारंटरों के लिए एक रूढ़िवादी रिस्क स्कोर समीक्षा सीमा निर्धारित करें जहां छूटे हुए PEP का नुकसान बड़ा है।
- मार्केटप्लेस। अपनी आबादी के लिए मैच स्कोर भार को ट्यून करके उच्च-मात्रा वाले विक्रेता ऑनबोर्डिंग पर मैन्युअल-समीक्षा के बोझ को कम करें।
- आईगेमिंग। प्रत्येक नियामक के लिए आपके द्वारा चलाई गई सटीक सीमाओं और भारों का दस्तावेजीकरण करें, क्योंकि दोनों स्कोर और उनका विन्यास ऑडिट योग्य हैं।
डिडिट के साथ एकीकृत कैसे करें
- एक वर्कफ़्लो चरण के रूप में स्क्रीनिंग जोड़ें या सीधे
POST /v3/aml/को कॉल करें। - कंसोल में मैच स्कोर (100 का योग) और रिस्क स्कोर के लिए अपने भार निर्धारित करें।
- अपनी सीमाएं निर्धारित करें — मैच सीमा (डिफ़ॉल्ट 93) और अनुमोदन/समीक्षा सीमाएं (डिफ़ॉल्ट 80/100)।
- जहां भी आपके पास एक दस्तावेज़ संख्या है, वहां एक दस्तावेज़ संख्या पास करें ताकि गोल्डन की अधिलेखन ट्रिगर हो।
Unreviewedकतार पर काम करें औरApproved/Declinedनिर्णयों को अपने ऑनबोर्डिंग तर्क में प्रवाहित होने दें।
अक्सर पूछे जाने वाले प्रश्न
मैच स्कोर और रिस्क स्कोर में क्या अंतर है?
मैच स्कोर यह मापता है कि क्या वॉचलिस्ट हिट वास्तव में आपका ग्राहक है (पहचान का विश्वास)। रिस्क स्कोर यह मापता है कि यदि मिलान वास्तविक है तो वह इकाई कितनी खतरनाक है। इनकी गणना और सीमा निर्धारण स्वतंत्र रूप से किया जाता है।
डिफ़ॉल्ट भार क्या हैं?
मैच स्कोर: नाम 60%, जन्म तिथि 25%, देश 15% (योग 100 होना चाहिए)। रिस्क स्कोर: श्रेणी 50%, देश का जोखिम 30%, आपराधिक रिकॉर्ड 20%। सभी कंसोल में विन्यास योग्य हैं।
गोल्डन की क्या है?
यदि आप एक दस्तावेज़ संख्या प्रदान करते हैं और यह वॉचलिस्ट रिकॉर्ड से मेल खाता है, तो मैच स्कोर को 100% पर अधिलेखित कर दिया जाता है — एक दस्तावेज़-संख्या का मिलान निश्चित पहचान प्रमाण माना जाता है।
मैच सीमा से नीचे क्या होता है?
मैच सीमा (डिफ़ॉल्ट 93) से नीचे स्कोर करने वाली प्रोफ़ाइल को स्वचालित रूप से False Positive पर सेट कर दिया जाता है, ताकि वह रिकॉर्ड कितना भी जोखिम भरा क्यों न हो, वह कभी भी विश्लेषक तक नहीं पहुंचता।
रिस्क स्कोर निर्णय कैसे बनता है?
अनुमोदन सीमा (डिफ़ॉल्ट 80) से नीचे की स्थिति Approved है; अनुमोदन और समीक्षा (80-100) के बीच यह In Review है; समीक्षा सीमा (डिफ़ॉल्ट 100) से ऊपर यह Declined है।
शुरू करने के लिए तैयार हैं?
दस्तावेज़ों में AML स्क्रीनिंग अवलोकन पढ़ें, AML स्क्रीनिंग उत्पाद पृष्ठ पर संदर्भ में मॉडल देखें, और मूल्य निर्धारण पृष्ठ पर पारदर्शी प्रति-जांच मूल्य निर्धारण देखें। जब आप तैयार हों, तो मुफ्त में शुरू करें — हर महीने 500 मुफ्त KYC जांच, AML स्क्रीनिंग के साथ प्रति जांच $0.20।