मुख्य कंटेंट पर जाएं
Didit ने पहचान और धोखाधड़ी के लिए इंफ्रास्ट्रक्चर बनाने हेतु $7.5M जुटाए
Didit
ब्लॉग पर वापस जाएँ
ब्लॉग · 21 मई 2026

कॉन्फ़िगरेबल थ्रेशोल्ड के साथ एएमएल फाल्स पॉज़िटिव को कम करना (HI)

फाल्स पॉज़िटिव एएमएल स्क्रीनिंग की वास्तविक लागत हैं। डिडिट आपको मैच-स्कोर वेट, मैच थ्रेशोल्ड और जोखिम थ्रेशोल्ड को ट्यून करने की सुविधा देता है — और वास्तविक हिट को न छोड़ते हुए समीक्षा कतार को छोटा करने के लिए दस्तावेज़-संख्या.

द्वारा Diditअपडेट किया गया
reduce-aml-false-positives.png

एएमएल स्क्रीनिंग का गंदा रहस्य यह है कि मैच आसान होते हैं और नॉन-मैच महंगे होते हैं। कोई भी इंजन हर वॉचलिस्ट रिकॉर्ड को सतह पर ला सकता है जो आपके ग्राहक के नाम से मेल खाता है। असली काम — और असली लागत — उन लोगों को खारिज करना है जो वास्तव में आपके ग्राहक नहीं हैं। फाल्स पॉज़िटिव वह जगह है जहाँ अनुपालन टीमें अपने घंटे जलाती हैं, जहाँ ऑनबोर्डिंग धीमी हो जाती है, और जहाँ अच्छे ग्राहक अवरुद्ध हो जाते हैं क्योंकि वे सूची में किसी के साथ नाम साझा करते हैं।

डिडिट का एएमएल इंजन सिग्नल खोए बिना उस शोर को दबाने के लिए बनाया गया है। कॉन्फ़िगरेबल मैच-स्कोर वेट, एक ट्यूनेबल मैच थ्रेशोल्ड, कॉन्फ़िगरेबल जोखिम थ्रेशोल्ड, और दस्तावेज़-संख्या गोल्डन की के माध्यम से, आप समीक्षा कतार को उन हिट तक सीमित कर सकते हैं जो वास्तव में मायने रखती हैं — और एक नियामक को ठीक-ठीक यह साबित कर सकते हैं कि प्रत्येक दमन क्यों उचित था। यह सब प्रति चेक $0.20 की स्क्रीनिंग में शामिल है।

मुख्य निष्कर्ष

  • मैच वेट्स कॉन्फ़िगरेबल हैं। नाम (60%), जन्मतिथि (25%), और देश (15%) डिफ़ॉल्ट हैं — उन्हें अपनी जनसंख्या के अनुसार फिर से वेट करें, जब तक कि उनका योग 100 न हो।
  • मैच थ्रेशोल्ड (डिफ़ॉल्ट 93) यह तय करता है कि मानव तक क्या पहुँचता है। इसके नीचे कुछ भी स्वतः False Positive वर्गीकृत किया जाता है।
  • जोखिम थ्रेशोल्ड (डिफ़ॉल्ट अनुमोदित 80 / समीक्षा 100) यह तय करते हैं कि क्या Approved, In Review, या Declined है — इसलिए यहां तक कि वास्तविक मैच भी सभी कतारबद्ध नहीं होते हैं।
  • गोल्डन की। एक मिलान दस्तावेज़ संख्या मैच स्कोर को 100% तक ओवरराइड करती है, जिससे नाम की अस्पष्टता पूरी तरह से दूर हो जाती है।
  • प्रत्येक दमन का ऑडिट किया जा सकता है — समीक्षा स्थितियाँ अनुपालन को इस बात का एक बचाव योग्य रिकॉर्ड देती हैं कि प्रत्येक नॉन-मैच को क्यों खारिज किया गया था।
  • सभी ट्यूनिंग कंसोल में है; स्क्रीनिंग स्वयं प्रति चेक $0.20 है।

फाल्स पॉज़िटिव समस्या क्यों है जिसे हल करना महत्वपूर्ण है

1,300 से अधिक वॉचलिस्ट में, एक सामान्य नाम कई रिकॉर्ड से मेल खाएगा। भारी बहुमत ऐसे लोग हैं जो आपके ग्राहक के साथ केवल एक नाम साझा करते हैं — नामधारी, मैच नहीं। यदि आपका इंजन उन सभी को एक विश्लेषक के पास भेजता है, तो तीन चीजें होती हैं: ग्राहकों के इंतजार के दौरान ऑनबोर्डिंग धीमी हो जाती है, विश्लेषक की लागत बढ़ जाती है, और — सबसे खतरनाक रूप से — अलर्ट थकान आती है और एक वास्तविक हिट शोर के समुद्र में खारिज हो जाती है।

ट्यूनिंग का लक्ष्य अधिक मैच खोजना नहीं है। यह इंजन को पहचान के बारे में इतना आश्वस्त करना है कि वह नामधारियों को स्वयं खारिज कर सके, जिससे मनुष्यों को केवल उन रिकॉर्डों का न्याय करना पड़े जो संभवतः एक ही व्यक्ति हैं और वास्तविक जोखिम उठाते हैं। अच्छी तरह से किया गया, यह हजारों की समीक्षा कतार और दर्जनों की समीक्षा कतार के बीच का अंतर है — वास्तविक खतरों पर समान रिकॉल के साथ।

चार लीवर

डिडिट आपको चार स्वतंत्र नियंत्रण देता है। पहले तीन थ्रेशोल्ड और वेट हैं; चौथा एक हार्ड पहचान संकेत है।

1. मैच-स्कोर वेट्स

मैच स्कोर पहचान संकेतों का एक भारित मिश्रण है, जिसे कंसोल में कॉन्फ़िगर किया जा सकता है:

संकेतडिफ़ॉल्ट वेटइसे कब बढ़ाएँ
नाम समानता60%शायद ही कभी — अकेला नाम सबसे कमजोर विभेदक है
जन्म तिथि25%जब आप विश्वसनीय रूप से जन्मतिथि एकत्र करते हैं; इसे बढ़ाने से नामधारी शोर कम होता है
देश15%विशिष्ट न्यायालयों में केंद्रित आबादी के लिए

वेट्स का योग 100 होना चाहिए। यदि आपके अधिकांश फाल्स पॉज़िटिव साझा-नाम टकराव हैं और आप जन्मतिथि एकत्र करते हैं, तो नाम से जन्मतिथि में वेट बदलना सबसे अधिक लाभ वाला परिवर्तन है जिसे आप कर सकते हैं।

2. मैच थ्रेशोल्ड

मैच थ्रेशोल्ड (डिफ़ॉल्ट 93) "अनदेखा करें" और "समीक्षा करें" के बीच की रेखा है। इसके नीचे स्कोर करने वाली प्रोफ़ाइल स्वचालित रूप से False Positive पर सेट हो जाती है और कभी भी एक विश्लेषक तक नहीं पहुँचती है; इस पर या इसके ऊपर, प्रोफ़ाइल Unreviewed बन जाती है। अधिक आक्रामक रूप से दबाने के लिए थ्रेशोल्ड बढ़ाएँ; जाल को चौड़ा करने के लिए इसे कम करें। यह आपका प्राथमिक शोर डायल है।

3. जोखिम थ्रेशोल्ड

वास्तविक पहचान मैचों में भी, हर चीज को मानव की आवश्यकता नहीं होती है। रिस्क स्कोर के दो थ्रेशोल्ड — डिफ़ॉल्ट अनुमोदित 80 और समीक्षा 100 — पुष्टि किए गए मैचों को Approved (80 से नीचे), In Review (80-100), और Declined (100 से ऊपर) में सॉर्ट करते हैं। इन्हें ट्यून करने का मतलब है कि एक पुष्टिकृत लेकिन कम जोखिम वाला मैच (जैसे, एक मामूली नियामक-पंजीकरण प्रविष्टि) स्वतः अनुमोदित हो सकता है, समीक्षा के समय को वास्तविक चिंता के लिए आरक्षित कर सकता है।

4. गोल्डन की

सबसे मजबूत लीवर सबसे सरल भी है। यदि आप एक document_number पास करते हैं और यह वॉचलिस्ट रिकॉर्ड से मेल खाता है, तो मैच स्कोर को 100% तक ओवरराइड किया जाता है — दबाने के लिए कोई नामधारी अस्पष्टता नहीं है, क्योंकि एक दस्तावेज़ संख्या एक निश्चित पहचान संकेत है। जहाँ भी आप एक दस्तावेज़ संख्या एकत्र करते हैं, गोल्डन की उस विषय के लिए फाल्स पॉज़िटिव को पूरी तरह से हटा देती है।

तकनीकी विवरण

गोल्डन की को ट्रिगर करने के लिए एक दस्तावेज़ संख्या पास करें; बाकी को कंसोल में ट्यून करें।

curl -X POST https://verification.didit.me/v3/aml/ \
  -H "x-api-key: $DIDIT_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "first_name": "Maria",
    "last_name": "Gonzalez",
    "date_of_birth": "1984-03-12",
    "country": "ES",
    "document_number": "X1234567Z"
  }'

ट्यून किए गए वेट और थ्रेशोल्ड के साथ, कम-आत्मविश्वास वाले रिकॉर्ड False Positive के रूप में पूर्व-वर्गीकृत आते हैं, और केवल बाकी समीक्षा तक पहुंचते हैं:

{
  "aml_status": "Approved",
  "risk_score": 22,
  "matches": [
    { "profile_id": "prf_aa01", "match_score": 41, "match_status": "False Positive", "categories": ["Adverse Media"] },
    { "profile_id": "prf_aa02", "match_score": 38, "match_status": "False Positive", "categories": ["PEP 4"] }
  ]
}

ऑडिटेबिलिटी। प्रत्येक दमित रिकॉर्ड अपनी match_status और स्कोर को बनाए रखता है, इसलिए ऑडिट ट्रेल ठीक-ठीक दिखाता है कि प्रत्येक नॉन-मैच को क्यों खारिज किया गया था — "मैच स्कोर 41, 93 थ्रेशोल्ड से नीचे।" यह एक नियामक को एक बचाव योग्य उत्तर है, न कि एक ब्लैक बॉक्स।

मूल्य। प्रति चेक $0.20; सभी ट्यूनिंग शामिल है, थ्रेशोल्ड नियंत्रण के लिए कोई प्रीमियम टियर नहीं।

उपयोग के मामले

  • फिनटेक। उच्च-मात्रा वाले उपभोक्ता ऑनबोर्डिंग पर नामधारी शोर को कम करने के लिए जन्मतिथि पर वेट शिफ्ट करें और मैच थ्रेशोल्ड बढ़ाएँ।
  • क्रिप्टो / वेब3। दस्तावेज़-समर्थित केवाईसी पर गोल्डन की का उपयोग करें ताकि पुष्टिकृत पहचान नामधारी समीक्षा को पूरी तरह से छोड़ दें।
  • ऋण देना। उधारकर्ताओं के लिए समीक्षा थ्रेशोल्ड को रूढ़िवादी रखें — एक थोड़ी बड़ी कतार स्वीकार करें जहाँ एक छूटा हुआ PEP महंगा हो।
  • बाज़ार। कम जोखिम वाले पुष्टिकृत मैचों को स्वतः अनुमोदित करें ताकि उच्च-मात्रा वाले विक्रेता ऑनबोर्डिंग समीक्षा कर्मचारियों पर अड़चन न बने।
  • आईगेमिंग। प्रति नियामक चलाए गए सटीक वेट और थ्रेशोल्ड का दस्तावेजीकरण करें, क्योंकि प्रत्येक दमन को स्कोर और स्थिति के अनुसार ऑडिट किया जा सकता है।

डिडिट के साथ कैसे एकीकृत करें

  1. पहले बेसलाइन करें। कुछ भी बदलने से पहले डिफ़ॉल्ट के साथ स्क्रीनिंग चलाएँ और अपनी फाल्स-पॉज़िटिव दर को मापें।
  2. मैच स्कोर को फिर से वेट करें उन संकेतों की ओर जो आप विश्वसनीय रूप से एकत्र करते हैं (आमतौर पर जन्मतिथि), वेट को 100 तक जोड़ते हुए।
  3. मैच थ्रेशोल्ड को ट्यून करें ताकि यह निर्धारित किया जा सके कि कम-आत्मविश्वास वाले रिकॉर्ड को कितनी आक्रामक रूप से स्वतः खारिज किया जाता है।
  4. जोखिम थ्रेशोल्ड को ट्यून करें ताकि कम जोखिम वाले पुष्टिकृत मैच स्वतः अनुमोदित हों और केवल वास्तविक चिंता कतारबद्ध हो।
  5. दस्तावेज़ संख्या पास करें जहाँ भी आपके पास गोल्डन की को फायर करने के लिए हैं।

अक्सर पूछे जाने वाले प्रश्न

फाल्स पॉज़िटिव को कम करने का सबसे अच्छा तरीका क्या है?

यदि आप जन्मतिथि एकत्र करते हैं, तो मैच स्कोर वेट को उसकी ओर (नाम से दूर) स्थानांतरित करें और जहाँ आपके पास गोल्डन की को ट्रिगर करने के लिए एक दस्तावेज़ संख्या पास करें। दोनों नामधारी टकरावों पर सीधे हमला करते हैं।

क्या मैं वेट और थ्रेशोल्ड को स्वयं ट्यून कर सकता हूँ?

हाँ — मैच-स्कोर वेट (100 तक जोड़ते हुए), मैच थ्रेशोल्ड (डिफ़ॉल्ट 93), और जोखिम थ्रेशोल्ड (डिफ़ॉल्ट अनुमोदित 80 / समीक्षा 100) सभी कंसोल में कॉन्फ़िगरेबल हैं।

क्या आक्रामक ट्यूनिंग से मुझे वास्तविक हिट नहीं मिलेंगे?

ट्यूनिंग पहचान आत्मविश्वास को लक्षित करता है, न कि जोखिम को। गोल्डन की और जन्मतिथि-भारित मिलान नामधारियों को खारिज करते हैं — वे लोग जो आपके ग्राहक नहीं हैं — इसलिए वास्तविक मैच अभी भी सतह पर आते हैं। आप अपनी जोखिम भूख के अनुसार थ्रेशोल्ड निर्धारित करते हैं।

गोल्डन की क्या है?

एक मिलान दस्तावेज़ संख्या मैच स्कोर को 100% तक ओवरराइड करती है, क्योंकि एक दस्तावेज़ संख्या एक निश्चित पहचान संकेत है। यह उस विषय के लिए नामधारी अस्पष्टता को पूरी तरह से हटा देती है।

क्या थ्रेशोल्ड ट्यूनिंग अतिरिक्त है?

नहीं। सभी कॉन्फ़िगरेशन $0.20-प्रति-चेक मूल्य में शामिल है; आपके स्वयं के थ्रेशोल्ड पर नियंत्रण के लिए कोई प्रीमियम टियर नहीं है।

शुरू करने के लिए तैयार हैं?

दस्तावेज़ों में एएमएल स्क्रीनिंग अवलोकन पढ़ें, एएमएल स्क्रीनिंग उत्पाद पृष्ठ पर नियंत्रण देखें, और मूल्य निर्धारण पृष्ठ पर पारदर्शी प्रति-चेक मूल्य निर्धारण देखें। जब आप तैयार हों, तो मुफ्त में शुरू करें — हर महीने 500 मुफ्त केवाईसी चेक, एएमएल स्क्रीनिंग के साथ प्रति चेक $0.20 पर।

पहचान और धोखाधड़ी के लिए इंफ्रास्ट्रक्चर।

KYC, KYB, ट्रांज़ैक्शन मॉनिटरिंग और वॉलेट स्क्रीनिंग के लिए एक API। 5 मिनट में इंटीग्रेट करें।

इस पेज को समराइज़ करने के लिए AI से पूछें
थ्रेशोल्ड के साथ एएमएल फाल्स पॉज़िटिव को कम करना | डिडिट.