Extraindo Dados de Documentos com a API OCR da Didit e Python (PT-BR)
Aprenda a integrar perfeitamente a poderosa API OCR da Didit com Python para extrair dados cruciais de documentos de identidade. Este guia cobre desde a configuração do ambiente até o processamento de relatórios de verificação.

Integração Sem EsforçoA API OCR da Didit oferece uma interface direta e amigável para desenvolvedores em Python, permitindo integração rápida em sistemas existentes para extração de dados de documentos.
Extração Abrangente de DadosAlém do texto básico, a Verificação de ID da Didit extrai uma riqueza de informações estruturadas, incluindo detalhes pessoais, especificações do documento e pontuações de qualidade da imagem, garantindo uma captura de dados completa.
Relatórios de Verificação RobustosA API fornece relatórios JSON detalhados, oferecendo insights granulares sobre o status da verificação, campos extraídos e verificações de autenticidade, cruciais para conformidade e gerenciamento de riscos.
Solução Escalável e SeguraA plataforma modular e nativa de IA da Didit garante que a extração de dados de seus documentos não seja apenas precisa, mas também escalável e segura, apoiada por recursos como KYC Essencial Gratuito e sem taxas de configuração.
O Poder do OCR na Verificação de Identidade
No cenário digital de hoje, verificar identidades de forma precisa e eficiente é fundamental para empresas em todos os setores. A tecnologia de Reconhecimento Óptico de Caracteres (OCR) desempenha um papel fundamental nisso, permitindo a extração automática de dados de documentos de identidade como passaportes, carteiras de motorista e carteiras de identidade. Essa automação não apenas acelera o processo de integração, mas também reduz significativamente o erro humano e o potencial de fraude. No entanto, nem todas as soluções OCR são iguais. A chave está em encontrar uma API robusta, precisa e fácil de integrar, que forneça recursos abrangentes de extração e verificação de dados.
A API de Verificação de ID da Didit é projetada precisamente para este desafio. Ela aproveita algoritmos avançados nativos de IA para ler e extrair informações com precisão de uma ampla gama de documentos de identidade globais. Isso vai além do simples reconhecimento de texto; a Didit realiza verificações de autenticidade, valida dados contra padrões conhecidos e fornece uma saída estruturada que pode ser usada diretamente em suas aplicações. Para desenvolvedores que trabalham com Python, integrar essa capacidade poderosa é simplificado e eficiente, permitindo a criação de fluxos de trabalho sofisticados de verificação de identidade com o mínimo de esforço.
Começando com a Integração OCR Python da Didit
Integrar a API OCR da Didit com Python é um processo direto projetado para desenvolvedores. O primeiro passo envolve autenticar suas solicitações usando uma chave de API. Uma vez autenticado, você pode enviar imagens de documentos de identidade (frente e verso, se aplicável) para o endpoint /v3/id-verification/. O produto de Verificação de ID da Didit lida com uma variedade de tipos de documentos, incluindo Passaportes, Carteiras de Identidade e Carteiras de Motorista, e suporta formatos de imagem comuns como JPEG, PNG, WebP, TIFF e PDF, com um tamanho máximo de arquivo de 5MB por imagem.
Além do envio básico de imagens, a API oferece parâmetros opcionais poderosos. Por exemplo, você pode definir perform_document_liveness como true para garantir que o documento digitalizado não seja uma cópia digitalizada ou tenha sofrido substituição de retrato, adicionando uma camada crucial de prevenção de fraudes. Você também pode definir uma minimum_age, que automaticamente recusa usuários abaixo de uma idade especificada, um recurso particularmente útil para cenários que exigem verificação de idade, como em jogos, vendas de álcool ou plataformas de conteúdo com restrição de idade. Essa flexibilidade permite que as empresas personalizem o processo de verificação para suas necessidades específicas de conformidade e risco, aproveitando a arquitetura modular da Didit.
Entendendo o Relatório de Verificação de ID
Após o envio e processamento bem-sucedidos, a API de Verificação de ID da Didit retorna um relatório JSON abrangente. Este relatório é a base do seu processo de verificação de identidade, fornecendo insights detalhados sobre os dados extraídos e o status geral da verificação. O relatório é estruturado para ser facilmente analisável e inclui várias seções principais:
- Status da Verificação de ID: Isso fornece o status geral da sessão (por exemplo, 'Aprovado', 'Recusado', 'Em Revisão') e resultados específicos da verificação.
- Detalhes do Documento: Informações sobre o documento verificado, como
document_type(por exemplo, 'Passaporte', 'Carteira de Identidade'),document_numbereexpiration_date. - Informações Pessoais: Dados biográficos extraídos, incluindo
first_name,last_name,date_of_birth,genderenationality. A Didit também forneceage, que é particularmente útil para cenários de estimativa de idade que preservam a privacidade. - Mídia do Documento: URLs temporárias para imagens e vídeos capturados, permitindo revisão visual, se necessário. Isso inclui
portrait_image,front_imageeback_image. - Informações de Endereço: Dados de endereço estruturados, incluindo
formatted_addresse um objetoparsed_addresscom campos comocity,regionepostal_code, essencial para verificações de Comprovante de Residência. - Metadados de Verificação: Detalhes adicionais como
date_of_issue,issuing_statee pontuações de qualidade da imagem para as imagens frontal e traseira (front_image_quality_score,back_image_quality_score). Essas pontuações fornecem métricas valiosas sobre a clareza e usabilidade das imagens de documentos enviadas, ajudando a identificar possíveis problemas com o processo de captura.
Esses dados ricos e estruturados capacitam as empresas a tomar decisões informadas rapidamente e a manter trilhas de auditoria robustas, cruciais para conformidade e prevenção de crimes financeiros.
Recursos Avançados e Melhores Práticas
A API OCR da Didit vai além da simples extração de dados. Por exemplo, o objeto ImageQualityScore dentro do relatório fornece métricas granulares como focus_score, brightness_score, resolution_score e um overall_score. Essas pontuações são vitais para garantir a qualidade dos documentos enviados, o que impacta diretamente a precisão do OCR e a confiabilidade geral da verificação. Ao analisar essas pontuações, você pode implementar lógica para solicitar imagens de melhor qualidade dos usuários, se necessário, melhorando a taxa de sucesso das verificações.
Outro recurso poderoso é a capacidade de gerar relatórios em PDF prontos para conformidade para qualquer sessão de verificação usando o endpoint /v3/session/{sessionId}/generate-pdf. Esses PDFs incluem decisões de identidade, dados de documentos extraídos e detalhes de auditoria, simplificando o registro e a conformidade regulatória. Além disso, o endpoint /v3/session/{sessionId}/decision/ permite recuperar resultados completos da sessão de verificação, incluindo pontuações de vivacidade, resultados de correspondência facial e status de processamento atual, oferecendo uma imagem completa da jornada de verificação de identidade do usuário.
Ao integrar, é uma boa prática lidar com várias respostas e status da API de forma elegante. Por exemplo, o campo id_verification.status pode indicar 'Recusado' se forem encontrados problemas, como um documento expirado ou uma verificação de vivacidade falha. A implementação de lógica condicional com base nesses status garante que sua aplicação possa responder adequadamente, seja solicitando mais informações do usuário ou escalando o caso para revisão manual. A abordagem "developer-first" da Didit, com acesso instantâneo ao sandbox e documentação pública, facilita a experimentação e a construção de integrações resilientes.
Como a Didit Ajuda
A Didit oferece uma solução incomparável para extração de dados de documentos e verificação de identidade através de sua plataforma nativa de IA e "developer-first". Nosso produto de Verificação de ID, impulsionado por OCR avançado, extrai dados precisamente de documentos de identidade globais. Ao contrário de outros provedores, a Didit oferece KYC Essencial Gratuito, permitindo que você comece a verificar identidades sem custos iniciais. Nossa arquitetura modular significa que você pode integrar perfeitamente apenas os componentes de que precisa, como Vivacidade Passiva e Ativa para prevenção de fraudes, Correspondência Facial 1:1 para comparações biométricas e Comprovante de Residência para verificações abrangentes. Não há taxas de configuração, e nosso modelo de pagamento por verificação bem-sucedida garante custo-benefício. Ao escolher a Didit, você aproveita uma plataforma construída para escala global, automação em vez de revisão manual e dados de identidade estruturados, tudo acessível via APIs limpas ou um Console de Negócios sem código.
Pronto para Começar?
Pronto para ver a Didit em ação? Obtenha uma demonstração gratuita hoje.
Comece a verificar identidades gratuitamente com o nível gratuito da Didit.