Saltar para o conteúdo principal
Didit angaria 7,5 milhões de dólares para construir a infraestrutura para identidade e fraude
Didit
Voltar ao blog
Blog · 6 de março de 2026

Integração da API OCR da Didit com Python para Extração de Dados de Documentos (PT-PT)

Descubra como integrar a potente API OCR da Didit com Python para extrair dados cruciais de documentos de identidade. Este guia abrange desde a configuração do ambiente até o processamento de relatórios de verificação.

Por DiditAtualizado
integrating-didits-ocr-api-with-python-for-document-data-extraction.png

Integração SimplificadaA API OCR da Didit oferece uma interface direta e amigável para programadores Python, permitindo uma integração rápida em sistemas existentes para extração de dados de documentos.

Extração Abrangente de DadosPara além do texto básico, a Verificação de Identidade da Didit extrai uma riqueza de informações estruturadas, incluindo detalhes pessoais, especificidades do documento e pontuações de qualidade da imagem, garantindo uma captura de dados completa.

Relatórios de Verificação RobustosA API fornece relatórios JSON detalhados, oferecendo informações granulares sobre o estado da verificação, campos extraídos e verificações de autenticidade, cruciais para conformidade e gestão de risco.

Solução Escalável e SeguraA plataforma modular e IA-nativa da Didit garante que a extração de dados dos seus documentos não é apenas precisa, mas também escalável e segura, apoiada por funcionalidades como KYC Core Gratuito e sem taxas de configuração.

O Poder do OCR na Verificação de Identidade

No panorama digital atual, verificar identidades de forma precisa e eficiente é primordial para empresas em todos os setores. A tecnologia de Reconhecimento Ótico de Caracteres (OCR) desempenha um papel fulcral nisso, permitindo a extração automática de dados de documentos de identidade como passaportes, cartas de condução e cartões de identificação. Esta automação não só acelera o processo de integração, como também reduz significativamente o erro humano e o potencial de fraude. No entanto, nem todas as soluções OCR são iguais. A chave reside em encontrar uma API que seja robusta, precisa e fácil de integrar, proporcionando capacidades abrangentes de extração e verificação de dados.

A API de Verificação de Identidade da Didit foi concebida precisamente para este desafio. Ela aproveita algoritmos avançados IA-nativos para ler e extrair informações com precisão de uma vasta gama de documentos de identidade globais. Isto vai além do simples reconhecimento de texto; a Didit realiza verificações de autenticidade, valida dados contra padrões conhecidos e fornece uma saída estruturada que pode ser usada diretamente nas suas aplicações. Para programadores que trabalham com Python, integrar esta capacidade poderosa é simplificado e eficiente, permitindo a criação de fluxos de trabalho sofisticados de verificação de identidade com um esforço mínimo.

Primeiros Passos com a Integração OCR Python da Didit

Integrar a API OCR da Didit com Python é um processo simples concebido para programadores. O primeiro passo envolve a autenticação dos seus pedidos usando uma chave de API. Uma vez autenticado, pode enviar imagens de documentos de identidade (frente e verso, se aplicável) para o endpoint /v3/id-verification/. O produto de Verificação de Identidade da Didit lida com uma variedade de tipos de documentos, incluindo Passaportes, Cartões de Identidade e Cartas de Condução, e suporta formatos de imagem comuns como JPEG, PNG, WebP, TIFF e PDF, com um tamanho máximo de ficheiro de 5MB por imagem.

Para além da submissão básica de imagens, a API oferece parâmetros opcionais poderosos. Por exemplo, pode definir perform_document_liveness como true para garantir que o documento a ser digitalizado não é uma cópia projetada ou que sofreu uma substituição de retrato, adicionando uma camada crucial de prevenção de fraude. Também pode definir uma minimum_age, que automaticamente recusa utilizadores com idade inferior à especificada, uma funcionalidade particularmente útil para cenários que exigem verificação de idade, como em jogos, venda de álcool ou plataformas de conteúdo com restrição de idade. Esta flexibilidade permite que as empresas personalizem o processo de verificação de acordo com os seus requisitos específicos de conformidade e risco, aproveitando a arquitetura modular da Didit.

Compreender o Relatório de Verificação de Identidade

Após a submissão e processamento bem-sucedidos, a API de Verificação de Identidade da Didit retorna um relatório JSON abrangente. Este relatório é a pedra angular do seu processo de verificação de identidade, fornecendo informações detalhadas sobre os dados extraídos e o estado geral da verificação. O relatório está estruturado para ser facilmente analisável e inclui várias secções chave:

  • Estado da Verificação de Identidade: Isto fornece o estado geral da sessão (por exemplo, 'Aprovado', 'Recusado', 'Em Revisão') e resultados de verificação específicos.
  • Detalhes do Documento: Informações sobre o documento verificado, como document_type (por exemplo, 'Passaporte', 'Cartão de Identidade'), document_number e expiration_date.
  • Informações Pessoais: Dados biográficos extraídos, incluindo first_name, last_name, date_of_birth, gender e nationality. A Didit também fornece age, que é particularmente útil para cenários de estimativa de idade que preservam a privacidade.
  • Mídia do Documento: URLs temporários para imagens e vídeos capturados, permitindo revisão visual, se necessário. Isto inclui portrait_image, front_image e back_image.
  • Informações de Endereço: Dados de endereço estruturados, incluindo formatted_address e um objeto parsed_address com campos como city, region e postal_code, essenciais para verificações de Prova de Morada.
  • Metadados de Verificação: Detalhes adicionais como date_of_issue, issuing_state e pontuações de qualidade de imagem para as imagens da frente e do verso (front_image_quality_score, back_image_quality_score). Estas pontuações fornecem métricas valiosas sobre a clareza e usabilidade das imagens de documentos submetidas, ajudando a identificar potenciais problemas com o processo de captura.

Estes dados ricos e estruturados capacitam as empresas a tomar decisões informadas rapidamente e a manter registos de auditoria robustos, cruciais para a conformidade e prevenção de crimes financeiros.

Funcionalidades Avançadas e Melhores Práticas

A API OCR da Didit vai além da simples extração de dados. Por exemplo, o objeto ImageQualityScore dentro do relatório fornece métricas granulares como focus_score, brightness_score, resolution_score e um overall_score. Estas pontuações são vitais para garantir a qualidade dos documentos submetidos, o que impacta diretamente a precisão do OCR e a fiabilidade geral da verificação. Ao analisar estas pontuações, pode implementar lógica para solicitar imagens de melhor qualidade aos utilizadores, se necessário, melhorando a taxa de sucesso das verificações.

Outra funcionalidade poderosa é a capacidade de gerar relatórios PDF prontos para conformidade para qualquer sessão de verificação usando o endpoint /v3/session/{sessionId}/generate-pdf. Estes PDFs incluem decisões de identidade, dados de documentos extraídos e detalhes de auditoria, simplificando a manutenção de registos e a conformidade regulamentar. Além disso, o endpoint /v3/session/{sessionId}/decision/ permite-lhe recuperar resultados completos da sessão de verificação, incluindo pontuações de vivacidade, resultados de correspondência facial e estado atual do processamento, oferecendo uma imagem completa da jornada de verificação de identidade do utilizador.

Ao integrar, é uma boa prática lidar com várias respostas e estados da API de forma elegante. Por exemplo, o campo id_verification.status pode indicar 'Declined' se forem encontrados problemas, como um documento expirado ou uma verificação de vivacidade falhada. Implementar lógica condicional com base nestes estados garante que a sua aplicação pode responder adequadamente, seja solicitando mais informações ao utilizador ou escalando o caso para revisão manual. A abordagem "developer-first" da Didit, com acesso instantâneo à sandbox e documentação pública, facilita a experimentação e a construção de integrações resilientes.

Como a Didit Ajuda

A Didit oferece uma solução incomparável para extração de dados de documentos e verificação de identidade através da sua plataforma IA-nativa e "developer-first". O nosso produto de Verificação de Identidade, alimentado por OCR avançado, extrai dados com precisão de documentos de identidade globais. Ao contrário de outros fornecedores, a Didit oferece KYC Core Gratuito, permitindo-lhe começar a verificar identidades sem custos iniciais. A nossa arquitetura modular significa que pode integrar perfeitamente apenas os componentes de que necessita, como Vivacidade Passiva e Ativa para prevenção de fraude, Correspondência Facial 1:1 para comparações biométricas e Prova de Morada para verificações abrangentes. Não há taxas de configuração, e o nosso modelo de pagamento por verificação bem-sucedida garante a relação custo-eficácia. Ao escolher a Didit, aproveita uma plataforma construída para escala global, automação em vez de revisão manual e dados de identidade estruturados, tudo acessível via APIs limpas ou uma Consola de Negócios sem código.

Pronto para Começar?

Pronto para ver a Didit em ação? Obtenha uma demonstração gratuita hoje.

Comece a verificar identidades gratuitamente com o nível gratuito da Didit.

Infraestrutura para identidade e fraude.

Uma API para KYC, KYB, Monitorização de Transações e Rastreio de Carteiras. Integre em 5 minutos.

Peça a uma IA para resumir esta página
Integrar API OCR Didit com Python para Dados Documentais.