Extracción de datos de documentos: integrando la API OCR de Didit con Python (ES)
Aprenda a integrar sin problemas la potente API OCR de Didit con Python para extraer datos cruciales de documentos de identidad. Esta guía cubre desde la configuración de su entorno hasta el procesamiento de informes de.

Integración sin esfuerzoLa API OCR de Didit ofrece una interfaz sencilla y amigable para desarrolladores en Python, lo que permite una rápida integración en sistemas existentes para la extracción de datos de documentos.
Extracción integral de datosMás allá del texto básico, la verificación de identidad de Didit extrae una gran cantidad de información estructurada, incluyendo detalles personales, especificaciones de documentos y puntuaciones de calidad de imagen, asegurando una captura de datos exhaustiva.
Informes de verificación robustosLa API proporciona informes JSON detallados, ofreciendo información granular sobre el estado de la verificación, los campos extraídos y las comprobaciones de autenticidad, crucial para el cumplimiento y la gestión de riesgos.
Solución escalable y seguraLa plataforma modular y nativa de IA de Didit garantiza que la extracción de datos de sus documentos no solo sea precisa, sino también escalable y segura, respaldada por características como KYC Core Gratuito y sin tarifas de configuración.
El poder del OCR en la verificación de identidad
En el panorama digital actual, verificar identidades de manera precisa y eficiente es primordial para las empresas de todos los sectores. La tecnología de Reconocimiento Óptico de Caracteres (OCR) desempeña un papel fundamental en esto, permitiendo la extracción automática de datos de documentos de identidad como pasaportes, licencias de conducir y tarjetas de identificación. Esta automatización no solo acelera el proceso de incorporación, sino que también reduce significativamente el error humano y el potencial de fraude. Sin embargo, no todas las soluciones OCR son iguales. La clave reside en encontrar una API robusta, precisa y fácil de integrar, que proporcione capacidades integrales de extracción y verificación de datos.
La API de verificación de identidad de Didit está diseñada precisamente para este desafío. Aprovecha algoritmos avanzados nativos de IA para leer y extraer información con precisión de una amplia gama de documentos de identidad globales. Esto va más allá del simple reconocimiento de texto; Didit realiza comprobaciones de autenticidad, valida datos contra patrones conocidos y proporciona una salida estructurada que se puede usar directamente en sus aplicaciones. Para los desarrolladores que trabajan con Python, la integración de esta potente capacidad es optimizada y eficiente, lo que permite la creación de flujos de trabajo sofisticados de verificación de identidad con un esfuerzo mínimo.
Primeros pasos con la integración OCR de Didit en Python
Integrar la API OCR de Didit con Python es un proceso sencillo diseñado para desarrolladores. El primer paso implica autenticar sus solicitudes utilizando una clave API. Una vez autenticado, puede enviar imágenes de documentos de identidad (anverso y reverso, si corresponde) al endpoint /v3/id-verification/. El producto de verificación de identidad de Didit maneja una variedad de tipos de documentos, incluidos pasaportes, tarjetas de identidad y licencias de conducir, y admite formatos de imagen comunes como JPEG, PNG, WebP, TIFF y PDF, con un tamaño máximo de archivo de 5 MB por imagen.
Más allá del envío básico de imágenes, la API ofrece potentes parámetros opcionales. Por ejemplo, puede establecer perform_document_liveness en true para asegurarse de que el documento que se escanea no sea una copia o que se le haya reemplazado el retrato, lo que añade una capa crucial de prevención de fraude. También puede definir una minimum_age, que rechaza automáticamente a los usuarios menores de una edad específica, una característica particularmente útil para escenarios que requieren verificación de edad, como en juegos, ventas de alcohol o plataformas de contenido con restricción de edad. Esta flexibilidad permite a las empresas adaptar el proceso de verificación a sus requisitos específicos de cumplimiento y riesgo, aprovechando la arquitectura modular de Didit.
Comprendiendo el informe de verificación de identidad
Tras la presentación y el procesamiento exitosos, la API de verificación de identidad de Didit devuelve un informe JSON completo. Este informe es la piedra angular de su proceso de verificación de identidad, proporcionando información detallada sobre los datos extraídos y el estado general de la verificación. El informe está estructurado para ser fácilmente analizable e incluye varias secciones clave:
- Estado de verificación de ID: Proporciona el estado general de la sesión (por ejemplo, 'Aprobado', 'Rechazado', 'En revisión') y resultados de verificación específicos.
- Detalles del documento: Información sobre el documento verificado, como
document_type(por ejemplo, 'Pasaporte', 'Tarjeta de identidad'),document_numberyexpiration_date. - Información personal: Datos biográficos extraídos, incluidos
first_name,last_name,date_of_birth,genderynationality. Didit también proporcionaage, que es particularmente útil para escenarios de estimación de edad que preservan la privacidad. - Medios del documento: URL temporales a imágenes y videos capturados, lo que permite una revisión visual si es necesario. Esto incluye
portrait_image,front_imageyback_image. - Información de dirección: Datos de dirección estructurados, incluida
formatted_addressy un objetoparsed_addresscon campos comocity,regionypostal_code, esenciales para las comprobaciones de prueba de domicilio. - Metadatos de verificación: Detalles adicionales como
date_of_issue,issuing_statey puntuaciones de calidad de imagen para las imágenes frontal y posterior (front_image_quality_score,back_image_quality_score). Estas puntuaciones proporcionan métricas valiosas sobre la claridad y la usabilidad de las imágenes de documentos enviadas, lo que ayuda a identificar posibles problemas con el proceso de captura.
Estos datos ricos y estructurados permiten a las empresas tomar decisiones informadas rápidamente y mantener registros de auditoría robustos, cruciales para el cumplimiento y la prevención de delitos financieros.
Funciones avanzadas y mejores prácticas
La API OCR de Didit va más allá de la simple extracción de datos. Por ejemplo, el objeto ImageQualityScore dentro del informe proporciona métricas granulares como focus_score, brightness_score, resolution_score y un overall_score. Estas puntuaciones son vitales para garantizar la calidad de los documentos enviados, lo que afecta directamente la precisión del OCR y la fiabilidad general de la verificación. Al analizar estas puntuaciones, puede implementar una lógica para solicitar imágenes de mejor calidad a los usuarios si es necesario, mejorando la tasa de éxito de las verificaciones.
Otra característica potente es la capacidad de generar informes PDF listos para el cumplimiento para cualquier sesión de verificación utilizando el endpoint /v3/session/{sessionId}/generate-pdf. Estos PDF incluyen decisiones de identidad, datos de documentos extraídos y detalles de auditoría, lo que simplifica el mantenimiento de registros y el cumplimiento normativo. Además, el endpoint /v3/session/{sessionId}/decision/ le permite recuperar los resultados completos de la sesión de verificación, incluidas las puntuaciones de vivacidad, los resultados de coincidencia facial y el estado de procesamiento actual, ofreciendo una imagen completa del recorrido de verificación de identidad del usuario.
Al integrar, es una buena práctica manejar diversas respuestas y estados de la API con elegancia. Por ejemplo, el campo id_verification.status puede indicar 'Declined' si se encuentran problemas, como un documento caducado o una comprobación de vivacidad fallida. La implementación de lógica condicional basada en estos estados garantiza que su aplicación pueda responder adecuadamente, ya sea solicitando más información al usuario o escalando el caso para una revisión manual. El enfoque de Didit centrado en el desarrollador, con acceso instantáneo a la zona de pruebas y documentación pública, facilita la experimentación y la creación de integraciones resistentes.
Cómo ayuda Didit
Didit ofrece una solución sin igual para la extracción de datos de documentos y la verificación de identidad a través de su plataforma nativa de IA y centrada en el desarrollador. Nuestro producto de Verificación de Identidad, impulsado por OCR avanzado, extrae datos con precisión de documentos de identidad globales. A diferencia de otros proveedores, Didit ofrece KYC Core Gratuito, lo que le permite comenzar a verificar identidades sin costos iniciales. Nuestra arquitectura modular significa que puede integrar sin problemas solo los componentes que necesita, como Detección de Vida Pasiva y Activa para la prevención de fraude, Coincidencia Facial 1:1 para comparaciones biométricas y Prueba de Domicilio para comprobaciones exhaustivas. No hay tarifas de configuración, y nuestro modelo de pago por verificación exitosa garantiza la rentabilidad. Al elegir Didit, aprovecha una plataforma creada para la escala global, la automatización sobre la revisión manual y los datos de identidad estructurados, todo accesible a través de API limpias o una Consola de Negocios sin código.
¿Listo para empezar?
¿Listo para ver Didit en acción? Obtenga una demostración gratuita hoy.
Comience a verificar identidades de forma gratuita con el nivel gratuito de Didit.