Blog · 25 Maret 2026

Mencegah Kecurangan: Memanfaatkan Nilai Shapley (ID)

Telusuri bagaimana Nilai Shapley, sebuah konsep dari teori permainan, merevolusi deteksi kecurangan dengan machine learning. Pelajari cara memahami kepentingan fitur dan membangun sistem pencegahan kecurangan yang lebih kuat.

Oleh Didit25 Maret 2026Diperbarui 22 Mei 2026

Mencegah Kecurangan: Memanfaatkan Nilai Shapley

Dalam lanskap kecurangan daring yang terus berkembang, sistem berbasis aturan tradisional seringkali gagal menghadapi serangan yang canggih. Machine learning (ML) menawarkan alternatif yang kuat, tetapi memahami mengapa sebuah model ML membuat prediksi tertentu sangat penting – terutama dalam skenario berisiko tinggi seperti transaksi keuangan dan verifikasi identitas. Di sinilah Nilai Shapley berperan, menawarkan pendekatan yang kuat dan dapat diinterpretasikan untuk pencegahan kecurangan. Mereka menyediakan cara yang adil untuk mendistribusikan kontribusi untuk sebuah prediksi di antara berbagai fitur yang digunakan oleh model.

Poin Penting Nilai Shapley menawarkan keuntungan signifikan dalam pencegahan kecurangan dengan memberikan wawasan yang jelas dan dapat dijelaskan ke dalam prediksi model.

Poin Penting Mereka membantu mengidentifikasi fitur yang paling berpengaruh dalam mendorong deteksi kecurangan, meningkatkan akurasi model dan mengurangi positif palsu.

Poin Penting Nilai Shapley memfasilitasi kepercayaan dan transparansi, yang sangat penting untuk kepatuhan terhadap peraturan dan penerimaan pengguna.

Poin Penting Pendekatan ini sangat efektif untuk model machine learning yang kompleks, seperti gradient boosting machines dan neural networks, yang jika tidak, merupakan 'kotak hitam'.

Memahami Nilai Shapley

Awalnya dikembangkan dalam teori permainan, Nilai Shapley menentukan rata-rata kontribusi marginal dari setiap fitur terhadap prediksi model. Bayangkan sebuah tim pemain (fitur) yang bekerja sama untuk mencapai tujuan (deteksi kecurangan). Nilai Shapley menghitung seberapa besar kontribusi setiap pemain terhadap keberhasilan keseluruhan, dengan mempertimbangkan semua kombinasi tim yang mungkin. Secara matematis, Nilai Shapley untuk fitur i dihitung sebagai:

Φ_i = Σ_S⊆F{i} (|S|!(|F|-|S|-1)! / |F|!) * [f(S∪{i}) - f(S)]

Di mana:

Φ_i adalah Nilai Shapley untuk fitur i
F adalah himpunan semua fitur
S adalah subset fitur yang tidak termasuk i
|S| adalah jumlah fitur dalam subset S
f(S) adalah prediksi model menggunakan hanya fitur dalam subset S

Sederhananya, ia menilai dampak penambahan sebuah fitur ke semua kombinasi fitur lainnya, kemudian merata-ratakan dampak tersebut. Ini memberikan ukuran yang adil dan konsisten tentang pentingnya setiap fitur.

Menerapkan Nilai Shapley untuk Deteksi Kecurangan

Dalam deteksi kecurangan, fitur mungkin termasuk hal-hal seperti jumlah transaksi, lokasi alamat IP, informasi perangkat, pola perilaku pengguna, dan, yang terpenting, skor verifikasi identitas dari layanan seperti Didit. Sebuah model machine learning yang dilatih pada data historis dapat memprediksi probabilitas kecurangan. Namun, mengetahui bahwa sebuah transaksi ditandai sebagai curang saja tidak cukup. Kita perlu memahami mengapa.

Nilai Shapley memberikan “mengapa” itu. Misalnya, sebuah model mungkin menandai sebuah transaksi sebagai curang dengan probabilitas 90%. Menerapkan Nilai Shapley mengungkapkan bahwa 60% dari probabilitas tersebut disebabkan oleh alamat IP berisiko tinggi, 20% oleh perubahan alamat pengiriman baru-baru ini, dan 10% oleh skor verifikasi identitas yang rendah. Wawasan granular ini sangat berharga.

Wawasan ini bukan hanya tentang memahami prediksi masa lalu; ini tentang meningkatkan prediksi di masa depan. Dengan mengidentifikasi fitur yang paling berpengaruh, kita dapat fokus pada peningkatan kualitas fitur tersebut atau mengembangkan fitur baru, yang mengarah pada sistem deteksi kecurangan yang lebih akurat dan kuat. Misalnya, jika skor verifikasi identitas yang rendah secara konsisten berkontribusi pada kecurangan, kita dapat berinvestasi dalam meningkatkan proses verifikasi identitas kita.

Manfaat Menggunakan Nilai Shapley dalam Pencegahan Kecurangan

Selain interpretasi yang lebih baik, menggunakan Nilai Shapley menawarkan beberapa manfaat utama:

Peningkatan Akurasi Model: Memahami pentingnya fitur memungkinkan penyempurnaan model yang ditargetkan.
Pengurangan Positif Palsu: Dengan mengidentifikasi alasan di balik prediksi kecurangan, kita dapat mengurangi jumlah transaksi sah yang salah ditandai sebagai curang.
Peningkatan Kepercayaan dan Transparansi: AI yang dapat dijelaskan membangun kepercayaan dengan pemangku kepentingan dan memfasilitasi kepatuhan terhadap peraturan. Menjelaskan alasan di balik penentuan kecurangan kepada pelanggan jauh lebih efektif daripada sekadar menyatakan “transaksi Anda diblokir.”
Deteksi Bias: Nilai Shapley dapat membantu mengungkap bias yang tidak disengaja dalam model, memastikan hasil yang adil dan merata.

Pertimbangan Praktis & Implementasi

Menghitung Nilai Shapley bisa mahal secara komputasi, terutama untuk model dengan banyak fitur. Namun, beberapa algoritma efisien, seperti TreeSHAP, telah dikembangkan untuk mengatasi tantangan ini. Algoritma ini memanfaatkan struktur pohon keputusan untuk memperkirakan Nilai Shapley jauh lebih cepat.

Perpustakaan Python populer seperti SHAP (SHapley Additive exPlanations) menyediakan implementasi yang mudah dari algoritma ini. Mengintegrasikan SHAP ke dalam pipeline machine learning yang ada relatif mudah. Prosesnya biasanya melibatkan pelatihan model Anda, lalu menggunakan SHAP untuk menjelaskan prediksi model terlatih.

Misalnya, pertimbangkan skenario di mana seorang pengguna mencoba membuat akun di platform e-commerce. Proses verifikasi identitas Didit berkontribusi pada skor yang menunjukkan keabsahan pengguna. Menggunakan SHAP, kita dapat mengukur seberapa besar skor Didit berkontribusi pada keputusan model untuk menyetujui atau menolak pembuatan akun. Skor Didit yang rendah, ditambah dengan faktor risiko lainnya, mungkin menjadi pendorong utama penolakan, memberikan pembenaran yang jelas.

Bagaimana Didit Membantu

Platform verifikasi identitas Didit yang kuat menyediakan komponen penting untuk sistem pencegahan kecurangan yang efektif. Dengan mengintegrasikan skor identitas dan sinyal risiko Didit ke dalam model machine learning Anda, Anda mendapatkan fitur yang kuat yang secara signifikan meningkatkan akurasi. Dikombinasikan dengan Nilai Shapley, Anda dapat memahami bagaimana data Didit berkontribusi pada deteksi kecurangan, memungkinkan Anda untuk mengoptimalkan strategi pencegahan kecurangan Anda secara keseluruhan.

Didit menawarkan:

Verifikasi Identitas Komprehensif: Verifikasi dokumen identitas, deteksi liveness, dan lakukan autentikasi biometrik.
Penilaian Risiko Real-time: Nilai risiko pengguna berdasarkan berbagai sinyal, termasuk informasi perangkat, alamat IP, dan biometrik perilaku.
Integrasi yang Mulus: Integrasikan API Didit ke dalam pipeline machine learning yang ada dengan mudah.

Siap Memulai?

Siap membuka kekuatan Nilai Shapley dan meningkatkan kemampuan pencegahan kecurangan Anda? Jelajahi platform Didit hari ini dan minta demo. Baca dokumentasi teknis kami untuk mempelajari lebih lanjut tentang API dan opsi integrasi kami. Jangan biarkan kecurangan merusak bisnis Anda – kendalikan dengan wawasan berbasis data!