कॉन्फ़िगरेबल थ्रेशोल्ड के साथ एएमएल फाल्स पॉज़िटिव को कम करना (HI)
फाल्स पॉज़िटिव एएमएल स्क्रीनिंग की वास्तविक लागत हैं। डिडिट आपको मैच-स्कोर वेट, मैच थ्रेशोल्ड और जोखिम थ्रेशोल्ड को ट्यून करने की सुविधा देता है — और वास्तविक हिट को न छोड़ते हुए समीक्षा कतार को छोटा करने के लिए दस्तावेज़-संख्या.

एएमएल स्क्रीनिंग का गंदा रहस्य यह है कि मैच आसान होते हैं और नॉन-मैच महंगे होते हैं। कोई भी इंजन हर वॉचलिस्ट रिकॉर्ड को सतह पर ला सकता है जो आपके ग्राहक के नाम से मेल खाता है। असली काम — और असली लागत — उन लोगों को खारिज करना है जो वास्तव में आपके ग्राहक नहीं हैं। फाल्स पॉज़िटिव वह जगह है जहाँ अनुपालन टीमें अपने घंटे जलाती हैं, जहाँ ऑनबोर्डिंग धीमी हो जाती है, और जहाँ अच्छे ग्राहक अवरुद्ध हो जाते हैं क्योंकि वे सूची में किसी के साथ नाम साझा करते हैं।
डिडिट का एएमएल इंजन सिग्नल खोए बिना उस शोर को दबाने के लिए बनाया गया है। कॉन्फ़िगरेबल मैच-स्कोर वेट, एक ट्यूनेबल मैच थ्रेशोल्ड, कॉन्फ़िगरेबल जोखिम थ्रेशोल्ड, और दस्तावेज़-संख्या गोल्डन की के माध्यम से, आप समीक्षा कतार को उन हिट तक सीमित कर सकते हैं जो वास्तव में मायने रखती हैं — और एक नियामक को ठीक-ठीक यह साबित कर सकते हैं कि प्रत्येक दमन क्यों उचित था। यह सब प्रति चेक $0.20 की स्क्रीनिंग में शामिल है।
मुख्य निष्कर्ष
- मैच वेट्स कॉन्फ़िगरेबल हैं। नाम (60%), जन्मतिथि (25%), और देश (15%) डिफ़ॉल्ट हैं — उन्हें अपनी जनसंख्या के अनुसार फिर से वेट करें, जब तक कि उनका योग 100 न हो।
- मैच थ्रेशोल्ड (डिफ़ॉल्ट 93) यह तय करता है कि मानव तक क्या पहुँचता है। इसके नीचे कुछ भी स्वतः
False Positiveवर्गीकृत किया जाता है। - जोखिम थ्रेशोल्ड (डिफ़ॉल्ट अनुमोदित 80 / समीक्षा 100) यह तय करते हैं कि क्या
Approved,In Review, याDeclinedहै — इसलिए यहां तक कि वास्तविक मैच भी सभी कतारबद्ध नहीं होते हैं। - गोल्डन की। एक मिलान दस्तावेज़ संख्या मैच स्कोर को 100% तक ओवरराइड करती है, जिससे नाम की अस्पष्टता पूरी तरह से दूर हो जाती है।
- प्रत्येक दमन का ऑडिट किया जा सकता है — समीक्षा स्थितियाँ अनुपालन को इस बात का एक बचाव योग्य रिकॉर्ड देती हैं कि प्रत्येक नॉन-मैच को क्यों खारिज किया गया था।
- सभी ट्यूनिंग कंसोल में है; स्क्रीनिंग स्वयं प्रति चेक $0.20 है।
फाल्स पॉज़िटिव समस्या क्यों है जिसे हल करना महत्वपूर्ण है
1,300 से अधिक वॉचलिस्ट में, एक सामान्य नाम कई रिकॉर्ड से मेल खाएगा। भारी बहुमत ऐसे लोग हैं जो आपके ग्राहक के साथ केवल एक नाम साझा करते हैं — नामधारी, मैच नहीं। यदि आपका इंजन उन सभी को एक विश्लेषक के पास भेजता है, तो तीन चीजें होती हैं: ग्राहकों के इंतजार के दौरान ऑनबोर्डिंग धीमी हो जाती है, विश्लेषक की लागत बढ़ जाती है, और — सबसे खतरनाक रूप से — अलर्ट थकान आती है और एक वास्तविक हिट शोर के समुद्र में खारिज हो जाती है।
ट्यूनिंग का लक्ष्य अधिक मैच खोजना नहीं है। यह इंजन को पहचान के बारे में इतना आश्वस्त करना है कि वह नामधारियों को स्वयं खारिज कर सके, जिससे मनुष्यों को केवल उन रिकॉर्डों का न्याय करना पड़े जो संभवतः एक ही व्यक्ति हैं और वास्तविक जोखिम उठाते हैं। अच्छी तरह से किया गया, यह हजारों की समीक्षा कतार और दर्जनों की समीक्षा कतार के बीच का अंतर है — वास्तविक खतरों पर समान रिकॉल के साथ।
चार लीवर
डिडिट आपको चार स्वतंत्र नियंत्रण देता है। पहले तीन थ्रेशोल्ड और वेट हैं; चौथा एक हार्ड पहचान संकेत है।
1. मैच-स्कोर वेट्स
मैच स्कोर पहचान संकेतों का एक भारित मिश्रण है, जिसे कंसोल में कॉन्फ़िगर किया जा सकता है:
| संकेत | डिफ़ॉल्ट वेट | इसे कब बढ़ाएँ |
|---|---|---|
| नाम समानता | 60% | शायद ही कभी — अकेला नाम सबसे कमजोर विभेदक है |
| जन्म तिथि | 25% | जब आप विश्वसनीय रूप से जन्मतिथि एकत्र करते हैं; इसे बढ़ाने से नामधारी शोर कम होता है |
| देश | 15% | विशिष्ट न्यायालयों में केंद्रित आबादी के लिए |
वेट्स का योग 100 होना चाहिए। यदि आपके अधिकांश फाल्स पॉज़िटिव साझा-नाम टकराव हैं और आप जन्मतिथि एकत्र करते हैं, तो नाम से जन्मतिथि में वेट बदलना सबसे अधिक लाभ वाला परिवर्तन है जिसे आप कर सकते हैं।
2. मैच थ्रेशोल्ड
मैच थ्रेशोल्ड (डिफ़ॉल्ट 93) "अनदेखा करें" और "समीक्षा करें" के बीच की रेखा है। इसके नीचे स्कोर करने वाली प्रोफ़ाइल स्वचालित रूप से False Positive पर सेट हो जाती है और कभी भी एक विश्लेषक तक नहीं पहुँचती है; इस पर या इसके ऊपर, प्रोफ़ाइल Unreviewed बन जाती है। अधिक आक्रामक रूप से दबाने के लिए थ्रेशोल्ड बढ़ाएँ; जाल को चौड़ा करने के लिए इसे कम करें। यह आपका प्राथमिक शोर डायल है।
3. जोखिम थ्रेशोल्ड
वास्तविक पहचान मैचों में भी, हर चीज को मानव की आवश्यकता नहीं होती है। रिस्क स्कोर के दो थ्रेशोल्ड — डिफ़ॉल्ट अनुमोदित 80 और समीक्षा 100 — पुष्टि किए गए मैचों को Approved (80 से नीचे), In Review (80-100), और Declined (100 से ऊपर) में सॉर्ट करते हैं। इन्हें ट्यून करने का मतलब है कि एक पुष्टिकृत लेकिन कम जोखिम वाला मैच (जैसे, एक मामूली नियामक-पंजीकरण प्रविष्टि) स्वतः अनुमोदित हो सकता है, समीक्षा के समय को वास्तविक चिंता के लिए आरक्षित कर सकता है।
4. गोल्डन की
सबसे मजबूत लीवर सबसे सरल भी है। यदि आप एक document_number पास करते हैं और यह वॉचलिस्ट रिकॉर्ड से मेल खाता है, तो मैच स्कोर को 100% तक ओवरराइड किया जाता है — दबाने के लिए कोई नामधारी अस्पष्टता नहीं है, क्योंकि एक दस्तावेज़ संख्या एक निश्चित पहचान संकेत है। जहाँ भी आप एक दस्तावेज़ संख्या एकत्र करते हैं, गोल्डन की उस विषय के लिए फाल्स पॉज़िटिव को पूरी तरह से हटा देती है।
तकनीकी विवरण
गोल्डन की को ट्रिगर करने के लिए एक दस्तावेज़ संख्या पास करें; बाकी को कंसोल में ट्यून करें।
curl -X POST https://verification.didit.me/v3/aml/ \
-H "x-api-key: $DIDIT_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"first_name": "Maria",
"last_name": "Gonzalez",
"date_of_birth": "1984-03-12",
"country": "ES",
"document_number": "X1234567Z"
}'
ट्यून किए गए वेट और थ्रेशोल्ड के साथ, कम-आत्मविश्वास वाले रिकॉर्ड False Positive के रूप में पूर्व-वर्गीकृत आते हैं, और केवल बाकी समीक्षा तक पहुंचते हैं:
{
"aml_status": "Approved",
"risk_score": 22,
"matches": [
{ "profile_id": "prf_aa01", "match_score": 41, "match_status": "False Positive", "categories": ["Adverse Media"] },
{ "profile_id": "prf_aa02", "match_score": 38, "match_status": "False Positive", "categories": ["PEP 4"] }
]
}
ऑडिटेबिलिटी। प्रत्येक दमित रिकॉर्ड अपनी match_status और स्कोर को बनाए रखता है, इसलिए ऑडिट ट्रेल ठीक-ठीक दिखाता है कि प्रत्येक नॉन-मैच को क्यों खारिज किया गया था — "मैच स्कोर 41, 93 थ्रेशोल्ड से नीचे।" यह एक नियामक को एक बचाव योग्य उत्तर है, न कि एक ब्लैक बॉक्स।
मूल्य। प्रति चेक $0.20; सभी ट्यूनिंग शामिल है, थ्रेशोल्ड नियंत्रण के लिए कोई प्रीमियम टियर नहीं।
उपयोग के मामले
- फिनटेक। उच्च-मात्रा वाले उपभोक्ता ऑनबोर्डिंग पर नामधारी शोर को कम करने के लिए जन्मतिथि पर वेट शिफ्ट करें और मैच थ्रेशोल्ड बढ़ाएँ।
- क्रिप्टो / वेब3। दस्तावेज़-समर्थित केवाईसी पर गोल्डन की का उपयोग करें ताकि पुष्टिकृत पहचान नामधारी समीक्षा को पूरी तरह से छोड़ दें।
- ऋण देना। उधारकर्ताओं के लिए समीक्षा थ्रेशोल्ड को रूढ़िवादी रखें — एक थोड़ी बड़ी कतार स्वीकार करें जहाँ एक छूटा हुआ PEP महंगा हो।
- बाज़ार। कम जोखिम वाले पुष्टिकृत मैचों को स्वतः अनुमोदित करें ताकि उच्च-मात्रा वाले विक्रेता ऑनबोर्डिंग समीक्षा कर्मचारियों पर अड़चन न बने।
- आईगेमिंग। प्रति नियामक चलाए गए सटीक वेट और थ्रेशोल्ड का दस्तावेजीकरण करें, क्योंकि प्रत्येक दमन को स्कोर और स्थिति के अनुसार ऑडिट किया जा सकता है।
डिडिट के साथ कैसे एकीकृत करें
- पहले बेसलाइन करें। कुछ भी बदलने से पहले डिफ़ॉल्ट के साथ स्क्रीनिंग चलाएँ और अपनी फाल्स-पॉज़िटिव दर को मापें।
- मैच स्कोर को फिर से वेट करें उन संकेतों की ओर जो आप विश्वसनीय रूप से एकत्र करते हैं (आमतौर पर जन्मतिथि), वेट को 100 तक जोड़ते हुए।
- मैच थ्रेशोल्ड को ट्यून करें ताकि यह निर्धारित किया जा सके कि कम-आत्मविश्वास वाले रिकॉर्ड को कितनी आक्रामक रूप से स्वतः खारिज किया जाता है।
- जोखिम थ्रेशोल्ड को ट्यून करें ताकि कम जोखिम वाले पुष्टिकृत मैच स्वतः अनुमोदित हों और केवल वास्तविक चिंता कतारबद्ध हो।
- दस्तावेज़ संख्या पास करें जहाँ भी आपके पास गोल्डन की को फायर करने के लिए हैं।
अक्सर पूछे जाने वाले प्रश्न
फाल्स पॉज़िटिव को कम करने का सबसे अच्छा तरीका क्या है?
यदि आप जन्मतिथि एकत्र करते हैं, तो मैच स्कोर वेट को उसकी ओर (नाम से दूर) स्थानांतरित करें और जहाँ आपके पास गोल्डन की को ट्रिगर करने के लिए एक दस्तावेज़ संख्या पास करें। दोनों नामधारी टकरावों पर सीधे हमला करते हैं।
क्या मैं वेट और थ्रेशोल्ड को स्वयं ट्यून कर सकता हूँ?
हाँ — मैच-स्कोर वेट (100 तक जोड़ते हुए), मैच थ्रेशोल्ड (डिफ़ॉल्ट 93), और जोखिम थ्रेशोल्ड (डिफ़ॉल्ट अनुमोदित 80 / समीक्षा 100) सभी कंसोल में कॉन्फ़िगरेबल हैं।
क्या आक्रामक ट्यूनिंग से मुझे वास्तविक हिट नहीं मिलेंगे?
ट्यूनिंग पहचान आत्मविश्वास को लक्षित करता है, न कि जोखिम को। गोल्डन की और जन्मतिथि-भारित मिलान नामधारियों को खारिज करते हैं — वे लोग जो आपके ग्राहक नहीं हैं — इसलिए वास्तविक मैच अभी भी सतह पर आते हैं। आप अपनी जोखिम भूख के अनुसार थ्रेशोल्ड निर्धारित करते हैं।
गोल्डन की क्या है?
एक मिलान दस्तावेज़ संख्या मैच स्कोर को 100% तक ओवरराइड करती है, क्योंकि एक दस्तावेज़ संख्या एक निश्चित पहचान संकेत है। यह उस विषय के लिए नामधारी अस्पष्टता को पूरी तरह से हटा देती है।
क्या थ्रेशोल्ड ट्यूनिंग अतिरिक्त है?
नहीं। सभी कॉन्फ़िगरेशन $0.20-प्रति-चेक मूल्य में शामिल है; आपके स्वयं के थ्रेशोल्ड पर नियंत्रण के लिए कोई प्रीमियम टियर नहीं है।
शुरू करने के लिए तैयार हैं?
दस्तावेज़ों में एएमएल स्क्रीनिंग अवलोकन पढ़ें, एएमएल स्क्रीनिंग उत्पाद पृष्ठ पर नियंत्रण देखें, और मूल्य निर्धारण पृष्ठ पर पारदर्शी प्रति-चेक मूल्य निर्धारण देखें। जब आप तैयार हों, तो मुफ्त में शुरू करें — हर महीने 500 मुफ्त केवाईसी चेक, एएमएल स्क्रीनिंग के साथ प्रति चेक $0.20 पर।