Extraire des données de documents : Intégration de l'API OCR de Didit avec Python (FR)
Découvrez comment intégrer l'API OCR puissante de Didit avec Python pour extraire des données cruciales des documents d'identité. Ce guide couvre tout, de la configuration de votre environnement au traitement des rapports de.
Intégration sans effortL'API OCR de Didit offre une interface simple et conviviale pour les développeurs Python, permettant une intégration rapide dans les systèmes existants pour l'extraction de données de documents.
Extraction complète des donnéesAu-delà du texte de base, la vérification d'identité de Didit extrait une mine d'informations structurées, y compris les détails personnels, les spécificités des documents et les scores de qualité d'image, assurant une capture de données exhaustive.
Rapports de vérification robustesL'API fournit des rapports JSON détaillés, offrant des informations granulaires sur l'état de la vérification, les champs extraits et les contrôles d'authenticité, essentiels pour la conformité et la gestion des risques.
Solution évolutive et sécuriséeLa plateforme modulaire et native en IA de Didit garantit que votre extraction de données de documents est non seulement précise, mais aussi évolutive et sécurisée, grâce à des fonctionnalités telles que le KYC Core gratuit et l'absence de frais d'installation.
La puissance de l'OCR dans la vérification d'identité
Dans le paysage numérique actuel, la vérification précise et efficace des identités est primordiale pour les entreprises de tous les secteurs. La technologie de reconnaissance optique de caractères (OCR) joue un rôle central à cet égard, permettant l'extraction automatique de données à partir de documents d'identité tels que les passeports, les permis de conduire et les cartes d'identité. Cette automatisation accélère non seulement le processus d'intégration, mais réduit également considérablement les erreurs humaines et le potentiel de fraude. Cependant, toutes les solutions OCR ne sont pas égales. La clé réside dans la recherche d'une API robuste, précise et facile à intégrer, offrant des capacités complètes d'extraction et de vérification des données.
L'API de vérification d'identité de Didit est conçue précisément pour ce défi. Elle exploite des algorithmes avancés natifs de l'IA pour lire et extraire avec précision les informations d'un large éventail de documents d'identité mondiaux. Cela va au-delà de la simple reconnaissance de texte ; Didit effectue des contrôles d'authenticité, valide les données par rapport à des modèles connus et fournit une sortie structurée qui peut être directement utilisée dans vos applications. Pour les développeurs travaillant avec Python, l'intégration de cette puissante capacité est simplifiée et efficace, permettant la création de flux de travail de vérification d'identité sophistiqués avec un minimum d'effort.
Démarrer avec l'intégration OCR Python de Didit
L'intégration de l'API OCR de Didit avec Python est un processus simple conçu pour les développeurs. La première étape consiste à authentifier vos requêtes à l'aide d'une clé API. Une fois authentifié, vous pouvez envoyer des images de documents d'identité (recto et verso, le cas échéant) au point de terminaison /v3/id-verification/. Le produit de vérification d'identité de Didit gère une variété de types de documents, y compris les passeports, les cartes d'identité et les permis de conduire, et prend en charge les formats d'image courants comme JPEG, PNG, WebP, TIFF et PDF, avec une taille de fichier maximale de 5 Mo par image.
Au-delà de la soumission d'images de base, l'API offre de puissants paramètres facultatifs. Par exemple, vous pouvez définir perform_document_liveness sur true pour vous assurer que le document numérisé n'est pas une copie écran ou n'a pas subi de remplacement de portrait, ajoutant une couche cruciale de prévention de la fraude. Vous pouvez également définir un minimum_age, qui refuse automatiquement les utilisateurs de moins d'un âge spécifié, une fonctionnalité particulièrement utile pour les scénarios nécessitant une vérification de l'âge, comme dans les jeux, la vente d'alcool ou les plateformes de contenu soumis à une restriction d'âge. Cette flexibilité permet aux entreprises d'adapter le processus de vérification à leurs exigences spécifiques de conformité et de risque, en tirant parti de l'architecture modulaire de Didit.
Comprendre le rapport de vérification d'identité
Après une soumission et un traitement réussis, l'API de vérification d'identité de Didit renvoie un rapport JSON complet. Ce rapport est la pierre angulaire de votre processus de vérification d'identité, fournissant des informations détaillées sur les données extraites et l'état général de la vérification. Le rapport est structuré pour être facilement analysable et comprend plusieurs sections clés :
- Statut de vérification d'identité : Cela fournit le statut général de la session (par exemple, 'Approuvé', 'Refusé', 'En cours d'examen') et les résultats spécifiques de la vérification.
- Détails du document : Informations sur le document vérifié, telles que
document_type(par exemple, 'Passeport', 'Carte d'identité'),document_numberetexpiration_date. - Informations personnelles : Données biographiques extraites, y compris
first_name,last_name,date_of_birth,genderetnationality. Didit fournit également l'age, ce qui est particulièrement utile pour les scénarios d'estimation de l'âge respectueux de la vie privée. - Média du document : URL temporaires vers les images et vidéos capturées, permettant une révision visuelle si nécessaire. Cela inclut
portrait_image,front_imageetback_image. - Informations d'adresse : Données d'adresse structurées, y compris
formatted_addresset un objetparsed_addressavec des champs commecity,regionetpostal_code, essentiels pour les vérifications de preuve d'adresse. - Métadonnées de vérification : Détails supplémentaires tels que
date_of_issue,issuing_stateet les scores de qualité d'image pour les images recto et verso (front_image_quality_score,back_image_quality_score). Ces scores fournissent des métriques précieuses sur la clarté et l'utilisabilité des images de documents soumises, aidant à identifier les problèmes potentiels avec le processus de capture.
Ces données riches et structurées permettent aux entreprises de prendre des décisions éclairées rapidement et de maintenir des pistes d'audit robustes, essentielles pour la conformité et la prévention de la criminalité financière.
Fonctionnalités avancées et meilleures pratiques
L'API OCR de Didit va au-delà de la simple extraction de données. Par exemple, l'objet ImageQualityScore dans le rapport fournit des métriques granulaires comme focus_score, brightness_score, resolution_score et un overall_score. Ces scores sont essentiels pour garantir la qualité des documents soumis, ce qui a un impact direct sur la précision de l'OCR et la fiabilité globale de la vérification. En analysant ces scores, vous pouvez implémenter une logique pour demander des images de meilleure qualité aux utilisateurs si nécessaire, améliorant ainsi le taux de réussite des vérifications.
Une autre fonctionnalité puissante est la possibilité de générer des rapports PDF conformes pour toute session de vérification à l'aide du point de terminaison /v3/session/{sessionId}/generate-pdf. Ces PDF incluent les décisions d'identité, les données de documents extraites et les détails d'audit, simplifiant la tenue des dossiers et la conformité réglementaire. De plus, le point de terminaison /v3/session/{sessionId}/decision/ vous permet de récupérer les résultats complets de la session de vérification, y compris les scores de vivacité, les résultats de correspondance faciale et l'état de traitement actuel, offrant une image complète du parcours de vérification d'identité de l'utilisateur.
Lors de l'intégration, il est recommandé de gérer avec élégance les diverses réponses et statuts de l'API. Par exemple, le champ id_verification.status peut indiquer 'Refusé' si des problèmes sont détectés, comme un document expiré ou un contrôle de vivacité échoué. L'implémentation d'une logique conditionnelle basée sur ces statuts garantit que votre application peut réagir de manière appropriée, que ce soit en demandant plus d'informations à l'utilisateur ou en escaladant le cas pour une révision manuelle. L'approche axée sur le développeur de Didit, avec un accès instantané au bac à sable et une documentation publique, facilite l'expérimentation et la création d'intégrations résilientes.
Comment Didit vous aide
Didit offre une solution inégalée pour l'extraction de données de documents et la vérification d'identité grâce à sa plateforme native en IA et axée sur les développeurs. Notre vérification d'identité, alimentée par une OCR avancée, extrait précisément les données des documents d'identité mondiaux. Contrairement à d'autres fournisseurs, Didit propose un KYC Core gratuit, vous permettant de commencer à vérifier les identités sans frais initiaux. Notre architecture modulaire signifie que vous pouvez intégrer de manière transparente uniquement les composants dont vous avez besoin, tels que la vivacité passive et active pour la prévention de la fraude, la correspondance faciale 1:1 pour les comparaisons biométriques et la preuve d'adresse pour des contrôles complets. Il n'y a pas de frais d'installation, et notre modèle de paiement par vérification réussie garantit la rentabilité. En choisissant Didit, vous tirez parti d'une plateforme conçue pour une échelle mondiale, l'automatisation par rapport à la révision manuelle et des données d'identité structurées, le tout accessible via des API claires ou une console métier sans code.
Prêt à commencer ?
Prêt à voir Didit en action ? Obtenez une démo gratuite dès aujourd'hui.
Commencez à vérifier les identités gratuitement avec le niveau gratuit de Didit.