تجاوز إلى المحتوى الرئيسي
Didit تجمع 7.5 مليون دولار لبناء البنية التحتية للهوية والاحتيال
Didit
العودة إلى المدونة
المدونة · 24 مارس 2026

نقاط الضعف في تقنية التعرف على الوجوه: هجمات باستخدام التصحيحات الخادعة (AR)

التصحيحات الخادعة هي تعديلات دقيقة على الصور يمكنها خداع أنظمة التعرف على الوجوه. يستكشف هذا المقال كيفية عمل هذه الهجمات، وتأثيرها على أمان الذكاء الاصطناعي، وكيفية الدفاع ضدها.

بواسطة Diditتحديث
adversarial-patch-attacks-face-recognition.png

نقاط الضعف في تقنية التعرف على الوجوه: هجمات باستخدام التصحيحات الخادعة

أصبحت تقنية التعرف على الوجوه منتشرة في كل مكان، حيث تدعم كل شيء بدءًا من فتح الهواتف الذكية وحتى أنظمة مراقبة الحدود. ومع ذلك، فإن هذا التسهيل يأتي مصحوبًا بخطر أمني متزايد: الهجمات الخصومية. أحد أشكال هذه الهجمات بشكل خاص هو التصحيحات الخادعة – تعديلات صغيرة، غالبًا ما تكون غير محسوسة على الصور، يمكن أن تعطل أداء حتى أكثر نماذج التعرف على الوجوه تقدمًا. يتعمق هذا المقال في كيفية عمل هذه الهجمات، والتداعيات على أمان الذكاء الاصطناعي، واستراتيجيات الدفاع ضدها.

الخلاصة الرئيسية 1 التصحيحات الخادعة تستغل نقاط الضعف في الأسس الرياضية لنماذج التعلم العميق، مما يتسبب في تصنيفات خاطئة مع الحد الأدنى من التغيير المرئي.

الخلاصة الرئيسية 2 هذه الهجمات ليست مجرد نظرية؛ فقد أظهر الباحثون هجمات ناجحة للتعرف على الوجه في سيناريوهات واقعية باستخدام التصحيحات المطبوعة والنظارات.

الخلاصة الرئيسية 3 يتطلب الدفاع ضد هجمات التصحيحات الخادعة نهجًا متعدد الطبقات، بما في ذلك التدريب الخصومي والمعالجة المسبقة للإدخال وهياكل النماذج القوية.

الخلاصة الرئيسية 4 تعتمد فعالية التصحيح الخادع بشكل كبير على بنية النموذج المحددة وبيانات التدريب وخوارزمية تحسين التصحيح.

فهم الهجمات الخصومية

في جوهرها، تهدف الهجمات الخصومية إلى إنشاء اضطرابات دقيقة على بيانات الإدخال تتسبب في قيام نماذج التعلم الآلي بإجراء تنبؤات غير صحيحة. يتم إنشاء هذه الاضطرابات من خلال الاستفادة من طريقة عمل النموذج الداخلية – على وجه التحديد، الحدود عالية الأبعاد التي تفصل بين الفئات المختلفة. نماذج التعلم العميق، على الرغم من قوتها، غالبًا ما تكون حساسة بشكل مدهش لهذه التغييرات الصغيرة. الهدف ليس جعل التغيير واضحًا للمراقب البشري، ولكن استغلال نقاط الضعف الرياضية للنموذج. مثال كلاسيكي هو إضافة نمط ضوضاء محسوب بعناية إلى صورة باندا، مما يتسبب في تصنيف النموذج لها بثقة على أنها غيبون.

كيف تعمل التصحيحات الخادعة في التعرف على الوجه

التصحيحات الخادعة هي نوع معين من الهجمات الخصومية المصممة لخداع أنظمة تصنيف الصور. في سياق التعرف على الوجوه، عادةً ما تكون هذه التصحيحات عبارة عن ملصقات أو أنماط صغيرة وغير مزعجة بصريًا، وعند وضعها على وجه الشخص، تتسبب في تحديد هويته بشكل خاطئ من قبل النظام. تتضمن عملية إنشاء هذه التصحيحات خوارزمية تحسين تبحث عن الحد الأدنى من الاضطراب اللازم لتحقيق تصنيف خاطئ مرغوب فيه. إليك تفصيل للعملية:

  1. اختيار الهدف: يختار المهاجم أولاً هوية الهدف – الشخص الذي يريد أن يعتقد النظام أن الضحية هي.
  2. تحسين التصحيح: تقوم الخوارزمية (غالبًا بناءً على هبوط التدرج) بتعديل التصحيح بشكل متكرر، وحساب كيفية تأثير كل تغيير على مخرجات النموذج. الهدف هو العثور على تصحيح يتسبب، عند تطبيقه على أي وجه، في توقع النموذج لهوية الهدف بثقة عالية.
  3. وضع التصحيح: يتم وضع التصحيح المحسن ماديًا على وجه الضحية (على سبيل المثال، كملصق أو إطار نظارة أو حتى مكياج).

تعتمد فعالية التصحيح على عدة عوامل، بما في ذلك حجمه وشكله ولونه وملمسه وموضعه. أظهر الباحثون في معهد ماساتشوستس للتكنولوجيا تصحيحات صغيرة مثل 1.5 × 1.5 بوصة يمكن أن تحقق معدل نجاح بنسبة 100٪ مقابل أنظمة التعرف على الوجوه التجارية من مسافة عدة أقدام. هذه التصحيحات لا تعتمد على إخفاء ملامح الوجه؛ بل تتلاعب بشكل خفي بالتمثيلات الداخلية للنموذج.

التداعيات والأمثلة الواقعية

التهديد الذي تشكله هجمات التصحيحات الخادعة يمتد إلى ما هو أبعد من العروض التوضيحية الأكاديمية. ضع في اعتبارك هذه السيناريوهات المحتملة:

  • تجاوز أنظمة الأمان: يمكن للمهاجم استخدام تصحيح لانتحال شخصية فرد مصرح له، والوصول إلى مرافق أو أنظمة آمنة.
  • تجنب المراقبة: يمكن للفرد استخدام تصحيح لتجنب التعرف عليه بواسطة كاميرات المراقبة.
  • سرقة الهوية: يمكن استخدام التصحيح جنبًا إلى جنب مع تقنيات أخرى لتسهيل سرقة الهوية أو الاحتيال.

أظهرت الأبحاث الحديثة أنه حتى التصحيحات منخفضة الدقة يمكن أن تكون فعالة، مما يجعل تنفيذها أسهل في الهجمات الواقعية. علاوة على ذلك، أظهرت بعض الهجمات القدرة على الانتقال عبر نماذج التعرف على الوجوه المختلفة، مما يعني أن التصحيح الأمثل لنظام واحد قد يعمل أيضًا ضد الآخرين. التطوير المقلق بشكل خاص هو إنشاء تصحيحات خصومية “عالمية” – تصحيحات مصممة لتعطيل مجموعة واسعة من النماذج دون الحاجة إلى تدريب محدد لكل نظام مستهدف.

الدفاع ضد التصحيحات الخادعة

حماية هجمات التصحيحات الخادعة هي تحدٍ معقد. تتضمن بعض استراتيجيات التخفيف ما يلي:

  • التدريب الخصومي: إعادة تدريب النموذج باستخدام أمثلة خصومية (صور ذات تصحيحات مطبقة) لجعله أكثر قوة. يعتبر هذا دفاعًا من الخط الأول، ولكنه يتطلب مجموعة كبيرة ومتنوعة من الأمثلة الخصومية.
  • المعالجة المسبقة للإدخال: يمكن أن تعطل تقنيات مثل تنعيم الصورة أو تغيير الحجم العشوائي أو ضغط JPEG فعالية التصحيح. ومع ذلك، يمكن أن تقلل هذه أيضًا من دقة التعرف على الوجه الشرعي قليلاً.
  • هياكل النماذج القوية: استخدام هياكل النماذج المقاومة بطبيعتها للاضطرابات الخصومية (على سبيل المثال، النماذج ذات ضمانات القوة المعتمدة).
  • اكتشاف الخصومة: استخدام نماذج منفصلة لاكتشاف وجود تصحيحات خصومية في الصور.
  • المصادقة متعددة العوامل: طلب عدة أشكال من التعريف (على سبيل المثال، التعرف على الوجه + كلمة المرور) لتقليل خطر الهجوم الناجح.

لا يوجد دفاع واحد مضمونًا. النهج ذو الطبقات، الذي يجمع بين تقنيات تخفيف متعددة، هو الاستراتيجية الأكثر فعالية.

كيف يساعد Didit

تم بناء منصة هوية Didit مع وضع الأمان كمبدأ أساسي. نعالج هجمات التصحيحات الخادعة و التزوير الحيوي من خلال العديد من الميزات الرئيسية:

  • اكتشاف الحياة: تتجاوز خوارزميات اكتشاف الحياة المتقدمة لدينا مجرد اكتشاف الحركة البسيطة، وتوظف تحليلًا وجهيًا ثلاثي الأبعاد متطورًا وآليات تحدي الاستجابة للتحقق من أن المستخدم هو شخص حقيقي.
  • التحقق متعدد الأنماط: تجمع Didit بين طرق التحقق المتعددة (على سبيل المثال، التحقق من المستندات التعريفية، واكتشاف الحياة، ومطابقة الوجه) لإنشاء نظام أكثر قوة وموثوقية.
  • المراقبة المستمرة: نقوم بتحديث نماذجنا وخوارزمياتنا باستمرار للبقاء في الطليعة في مواجهة التهديدات الناشئة، بما في ذلك أنواع جديدة من التصحيحات الخادعة.
  • تحليل إشارات الاحتيال: يحلل نظامنا مجموعة واسعة من إشارات الاحتيال، بما في ذلك معلومات الجهاز وعنوان IP والأنماط السلوكية، لتحديد الأنشطة المشبوهة.

هل أنت مستعد للبدء؟

حماية عملك من التهديد المتطور المتمثل في هجمات التعرف على الوجوه. اطلب عرضًا توضيحيًا لمنصة هوية Didit اليوم لمعرفة كيف يمكننا مساعدتك في تأمين أنظمتك وحماية مستخدميك. استكشف وثائقنا الفنية لفهم ميزات الأمان لدينا بالتفصيل.

الأسئلة الشائعة

ما الفرق بين التصحيح الخصومي والتزييف العميق؟

على الرغم من أن كلاهما شكلان من أشكال الهجمات القائمة على الذكاء الاصطناعي، إلا أنهما يختلفان في نهجهما. ينشئ التزييف العميق صورة أو فيديو اصطناعيًا بالكامل، بينما يعدل التصحيح الخصومي صورة موجودة لخداع النموذج. عادة ما تكون التصحيحات أقل كثافة حسابية من التزييف العميق.

هل يمكن أن تعمل التصحيحات الخصومية على جميع أنظمة التعرف على الوجوه؟

لا. تعتمد فعالية التصحيح على بنية النموذج المحددة وبيانات التدريب وخوارزمية تحسين التصحيح. ومع ذلك، تشير الأبحاث إلى أن بعض التصحيحات يمكن أن تنتقل عبر نماذج مختلفة، مما يجعلها تهديدًا أوسع.

كيف يمكنني اكتشاف ما إذا كان شخص ما يستخدم تصحيحًا خصوميًا؟

يعد اكتشاف التصحيحات الخصومية أمرًا صعبًا. يتم تطوير خوارزميات متخصصة لتحديد الحالات الشاذة الدقيقة في الصور التي قد تشير إلى وجود تصحيح، ولكنها ليست مضمونة بعد. يمكن أن تساعد تقنيات اكتشاف الحياة والمصادقة متعددة العوامل في التخفيف من المخاطر.

هل التصحيحات الخصومية تهديد كبير اليوم؟

على الرغم من أنها لا تزال مجالًا جديدًا نسبيًا من البحث، إلا أن هجمات التصحيحات الخصومية أصبحت تهديدًا واقعيًا بشكل متزايد. مع انتشار تقنية التعرف على الوجوه، يزداد التأثير المحتمل لهذه الهجمات. الدفاعات الاستباقية ضرورية.

بنية تحتية للهوية والاحتيال.

واجهة برمجية واحدة لـ KYC و KYB ومراقبة المعاملات وفحص المحافظ. ادمجها في 5 دقائق.

اطلب من الذكاء الاصطناعي تلخيص هذه الصفحة
هجمات التصحيحات الخادعة: تقنية التعرف على الوجوه.