Ves al contingut principal
Didit recapta 7,5M $ per construir la infraestructura per a identitat i frau
Didit
Torna al blog
Blog · 6 de març del 2026

Integració de l'API OCR de Didit amb Python per a l'Extracció de Dades Documentals (CA)

Aprèn a integrar perfectament la potent API OCR de Didit amb Python per extreure dades crucials de documents d'identitat. Aquesta guia cobreix des de la configuració del teu entorn fins al processament d'informes de verificació.

Per DiditActualitzat el
integrating-didits-ocr-api-with-python-for-document-data-extraction.png

Integració Sense EsforçL'API OCR de Didit ofereix una interfície senzilla i amigable per a desenvolupadors de Python, permetent una ràpida integració en sistemes existents per a l'extracció de dades documentals.

Extracció de Dades ExhaustivaMés enllà del text bàsic, la verificació d'identitat de Didit extreu una gran quantitat d'informació estructurada, incloent detalls personals, especificacions del document i puntuacions de qualitat d'imatge, garantint una captura de dades completa.

Informes de Verificació RobustosL'API proporciona informes JSON detallats, oferint coneixements granulars sobre l'estat de la verificació, els camps extrets i les comprovacions d'autenticitat, crucials per al compliment i la gestió de riscos.

Solució Escalable i SeguraLa plataforma modular i nativa d'IA de Didit assegura que l'extracció de dades dels vostres documents no només sigui precisa, sinó també escalable i segura, recolzada per funcions com KYC Core Gratuït i sense quotes de configuració.

El Poder de l'OCR en la Verificació d'Identitat

En el panorama digital actual, verificar les identitats de manera precisa i eficient és fonamental per a les empreses de tots els sectors. La tecnologia de Reconeixement Òptic de Caràcters (OCR) té un paper fonamental en això, permetent l'extracció automàtica de dades de documents d'identitat com passaports, carnets de conduir i targetes d'identitat. Aquesta automatització no només accelera el procés d'incorporació, sinó que també redueix significativament l'error humà i el potencial de frau. No obstant això, no totes les solucions OCR són iguals. La clau rau en trobar una API que sigui robusta, precisa i fàcil d'integrar, proporcionant capacitats completes d'extracció i verificació de dades.

L'API de verificació d'identitat de Didit està dissenyada precisament per a aquest repte. Aprofita algorismes avançats nadius d'IA per llegir i extreure informació amb precisió d'una àmplia gamma de documents d'identitat globals. Això va més enllà del simple reconeixement de text; Didit realitza comprovacions d'autenticitat, valida dades contra patrons coneguts i proporciona una sortida estructurada que es pot utilitzar directament a les vostres aplicacions. Per als desenvolupadors que treballen amb Python, integrar aquesta potent capacitat és senzill i eficient, permetent la creació de fluxos de treball de verificació d'identitat sofisticats amb un esforç mínim.

Començant amb la Integració OCR de Didit amb Python

La integració de l'API OCR de Didit amb Python és un procés senzill dissenyat per a desenvolupadors. El primer pas consisteix a autenticar les vostres sol·licituds mitjançant una clau API. Un cop autenticats, podeu enviar imatges de documents d'identitat (anvers i revers, si escau) al punt final /v3/id-verification/. El producte de verificació d'identitat de Didit gestiona una varietat de tipus de documents, inclosos passaports, targetes d'identitat i carnets de conduir, i admet formats d'imatge comuns com JPEG, PNG, WebP, TIFF i PDF, amb una mida màxima de fitxer de 5 MB per imatge.

Més enllà de la simple càrrega d'imatges, l'API ofereix paràmetres opcionals potents. Per exemple, podeu establir perform_document_liveness a true per assegurar-vos que el document que s'escaneja no és una còpia projectada o que no s'ha substituït el retrat, afegint una capa crucial de prevenció del frau. També podeu definir una minimum_age, que rebutja automàticament els usuaris menors d'una edat específica, una funció especialment útil per a escenaris que requereixen verificació d'edat, com ara en jocs, vendes d'alcohol o plataformes de contingut restringit per edat. Aquesta flexibilitat permet a les empreses adaptar el procés de verificació als seus requisits de compliment i risc específics, aprofitant l'arquitectura modular de Didit.

Comprendre l'Informe de Verificació d'Identitat

Un cop enviat i processat amb èxit, l'API de verificació d'identitat de Didit retorna un informe JSON complet. Aquest informe és la pedra angular del vostre procés de verificació d'identitat, proporcionant informació detallada sobre les dades extretes i l'estat general de la verificació. L'informe està estructurat per ser fàcilment analitzable i inclou diverses seccions clau:

  • Estat de la verificació d'identitat: Proporciona l'estat general de la sessió (p. ex., 'Aprovat', 'Rebutjat', 'En revisió') i resultats de verificació específics.
  • Detalls del document: Informació sobre el document verificat, com ara document_type (p. ex., 'Passaport', 'Targeta d'identitat'), document_number i expiration_date.
  • Informació personal: Dades biogràfiques extretes, incloent first_name, last_name, date_of_birth, gender i nationality. Didit també proporciona age, que és especialment útil per a escenaris d'estimació d'edat que preserven la privadesa.
  • Mitjans del document: URL temporals a imatges i vídeos capturats, permetent la revisió visual si cal. Això inclou portrait_image, front_image i back_image.
  • Informació d'adreça: Dades d'adreça estructurades, incloent formatted_address i un objecte parsed_address amb camps com city, region i postal_code, essencials per a les comprovacions de prova d'adreça.
  • Metadades de verificació: Detalls addicionals com date_of_issue, issuing_state i puntuacions de qualitat d'imatge tant per a les imatges frontals com posteriors (front_image_quality_score, back_image_quality_score). Aquestes puntuacions proporcionen mètriques valuoses sobre la claredat i la usabilitat de les imatges de documents enviades, ajudant a identificar possibles problemes amb el procés de captura.

Aquestes dades riques i estructurades permeten a les empreses prendre decisions informades ràpidament i mantenir robustos registres d'auditoria, crucials per al compliment i la prevenció de delictes financers.

Funcions Avançades i Bones Pràctiques

L'API OCR de Didit va més enllà de la simple extracció de dades. Per exemple, l'objecte ImageQualityScore dins de l'informe proporciona mètriques granulars com focus_score, brightness_score, resolution_score i una overall_score. Aquestes puntuacions són vitals per garantir la qualitat dels documents enviats, cosa que afecta directament la precisió de l'OCR i la fiabilitat general de la verificació. En analitzar aquestes puntuacions, podeu implementar lògica per sol·licitar imatges de millor qualitat als usuaris si cal, millorant la taxa d'èxit de les verificacions.

Una altra funció potent és la capacitat de generar informes PDF preparats per al compliment per a qualsevol sessió de verificació mitjançant el punt final /v3/session/{sessionId}/generate-pdf. Aquests PDF inclouen decisions d'identitat, dades de documents extretes i detalls d'auditoria, simplificant el manteniment de registres i el compliment normatiu. A més, el punt final /v3/session/{sessionId}/decision/ us permet recuperar els resultats complets de la sessió de verificació, incloent puntuacions de vivacitat, resultats de coincidència facial i l'estat de processament actual, oferint una imatge completa del recorregut de verificació d'identitat de l'usuari.

En integrar, és una bona pràctica gestionar diverses respostes i estats de l'API amb gràcia. Per exemple, el camp id_verification.status pot indicar 'Declined' si es troben problemes, com un document caducat o una comprovació de vivacitat fallida. La implementació d'una lògica condicional basada en aquests estats garanteix que la vostra aplicació pugui respondre adequadament, ja sigui sol·licitant més informació a l'usuari o escalant el cas per a una revisió manual. L'enfocament de Didit centrat en el desenvolupador, amb accés instantani a l'entorn de proves i documentació pública, facilita l'experimentació i la creació d'integracions resilients.

Com Ajuda Didit

Didit ofereix una solució inigualable per a l'extracció de dades de documents i la verificació d'identitat a través de la seva plataforma nativa d'IA, centrada en el desenvolupador. El nostre producte de Verificació d'Identitat, impulsat per OCR avançat, extreu dades amb precisió de documents d'identitat globals. A diferència d'altres proveïdors, Didit ofereix KYC Core Gratuït, cosa que us permet començar a verificar identitats sense costos inicials. La nostra arquitectura modular significa que podeu integrar sense problemes només els components que necessiteu, com ara Vivacitat Passiva i Activa per a la prevenció del frau, Coincidència Facial 1:1 per a comparacions biomètriques i Prova d'Adreça per a comprovacions exhaustives. No hi ha quotes de configuració, i el nostre model de pagament per comprovació exitosa garanteix l'eficiència dels costos. En triar Didit, aprofiteu una plataforma construïda per a l'escala global, l'automatització sobre la revisió manual i les dades d'identitat estructurades, tot accessible mitjançant API netes o una Consola de Negocis sense codi.

Preparat per Començar?

Preparat per veure Didit en acció? Obteniu una demostració gratuïta avui mateix.

Comenceu a verificar identitats de forma gratuïta amb el nivell gratuït de Didit.

Infraestructura per a identitat i frau.

Una API per a KYC, KYB, monitorització de transaccions i anàlisi de carteres. Integra-la en 5 minuts.

Demana a una IA que resumeixi aquesta pàgina
Integra l'API OCR de Didit amb Python per a Dades.