DiditのOCR APIとPythonを統合して文書データを抽出する方法 (JA)
Diditの強力なOCR APIとPythonをシームレスに統合し、本人確認書類から重要なデータを抽出する方法を学びましょう。このガイドでは、環境設定から検証レポートの処理まで、すべてを網羅しています。.

簡単な統合DiditのOCR APIは、Python向けに分かりやすく開発者フレンドリーなインターフェースを提供し、文書データ抽出のために既存システムへの迅速な統合を可能にします。
包括的なデータ抽出基本的なテキストだけでなく、Diditの本人確認機能は、個人情報、文書の詳細、画像品質スコアなど、豊富な構造化情報を抽出し、徹底的なデータ取得を保証します。
堅牢な検証レポートAPIは詳細なJSONレポートを提供し、検証ステータス、抽出されたフィールド、真正性チェックに関するきめ細かい洞察を提供します。これはコンプライアンスとリスク管理にとって重要です。
スケーラブルで安全なソリューションDiditのモジュール式AIネイティブプラットフォームは、文書データ抽出が正確であるだけでなく、スケーラブルで安全であることを保証します。無料のCore KYCやセットアップ費用なしといった機能によって裏付けられています。
本人確認におけるOCRの力
今日のデジタル環境において、身元を正確かつ効率的に確認することは、あらゆる分野の企業にとって最も重要です。光学的文字認識(OCR)技術は、パスポート、運転免許証、IDカードなどの本人確認書類からデータを自動的に抽出することを可能にし、この点で極めて重要な役割を果たします。この自動化は、オンボーディングプロセスを加速させるだけでなく、ヒューマンエラーや詐欺の可能性を大幅に低減します。しかし、すべてのOCRソリューションが同じように作られているわけではありません。重要なのは、堅牢で正確、かつ統合が容易で、包括的なデータ抽出および検証機能を提供するAPIを見つけることです。
Diditの本人確認APIは、まさにこの課題のために設計されています。高度なAIネイティブアルゴリズムを活用して、世界中の幅広い本人確認書類から情報を正確に読み取り、抽出します。これは単純なテキスト認識を超えて、真正性チェックを実行し、既知のパターンと照合してデータを検証し、アプリケーションで直接使用できる構造化された出力を提供します。Pythonを使用する開発者にとって、この強力な機能を統合することは効率的かつ合理化されており、最小限の労力で高度な本人確認ワークフローを作成できます。
DiditのPython OCR統合の開始
DiditのOCR APIとPythonの統合は、開発者向けに設計された簡単なプロセスです。最初のステップは、APIキーを使用してリクエストを認証することです。認証後、本人確認書類の画像(該当する場合は表と裏)を/v3/id-verification/エンドポイントに送信できます。Diditの本人確認製品は、パスポート、IDカード、運転免許証など、さまざまな種類の文書を処理し、JPEG、PNG、WebP、TIFF、PDFなどの一般的な画像形式をサポートしており、1画像あたりの最大ファイルサイズは5MBです。
基本的な画像送信を超えて、APIは強力なオプションパラメータを提供します。たとえば、perform_document_livenessをtrueに設定すると、スキャンされている文書が画面コピーではないこと、またはポートレートの置き換えが行われていないことを確認でき、詐欺防止の重要な層を追加します。また、minimum_ageを定義することもでき、指定された年齢未満のユーザーを自動的に拒否します。これは、ゲーム、アルコール販売、年齢制限コンテンツプラットフォームなど、年齢確認が必要なシナリオで特に役立つ機能です。この柔軟性により、企業はDiditのモジュール式アーキテクチャを活用して、特定のコンプライアンスおよびリスク要件に合わせて検証プロセスを調整できます。
本人確認レポートの理解
送信と処理が成功すると、Diditの本人確認APIは包括的なJSONレポートを返します。このレポートは、本人確認プロセスの礎石であり、抽出されたデータと全体的な検証ステータスに関する詳細な洞察を提供します。レポートは解析しやすいように構造化されており、いくつかの主要なセクションが含まれています。
- 本人確認ステータス: 全体的なセッションステータス(例:「承認済み」、「拒否済み」、「審査中」)と特定の検証結果を提供します。
- 文書詳細:
document_type(例:「パスポート」、「IDカード」)、document_number、expiration_dateなど、検証された文書に関する情報。 - 個人情報:
first_name、last_name、date_of_birth、gender、nationalityなどの抽出された個人情報。Diditはageも提供し、特にプライバシー保護を伴う年齢推定シナリオで役立ちます。 - 文書メディア: 取得された画像とビデオの一時的なURL。必要に応じて目視確認が可能です。これには
portrait_image、front_image、back_imageが含まれます。 - 住所情報:
formatted_addressや、city、region、postal_codeなどのフィールドを持つparsed_addressオブジェクトを含む構造化された住所データ。これは住所証明チェックに不可欠です。 - 検証メタデータ:
date_of_issue、issuing_stateなどの追加詳細、および表裏画像の画質スコア(front_image_quality_score、back_image_quality_score)。これらのスコアは、提出された文書画像の鮮明度と使いやすさに関する貴重な指標を提供し、キャプチャプロセスにおける潜在的な問題を特定するのに役立ちます。
この豊富で構造化されたデータは、企業が迅速に情報に基づいた意思決定を行い、コンプライアンスと金融犯罪防止に不可欠な堅牢な監査証跡を維持することを可能にします。
高度な機能とベストプラクティス
DiditのOCR APIは、単純なデータ抽出を超えています。たとえば、レポート内のImageQualityScoreオブジェクトは、focus_score、brightness_score、resolution_score、およびoverall_scoreなどのきめ細かい指標を提供します。これらのスコアは、提出された文書の品質を確保するために不可欠であり、OCRの精度と全体的な検証の信頼性に直接影響します。これらのスコアを分析することで、必要に応じてユーザーにより高品質の画像を要求するロジックを実装し、検証の成功率を向上させることができます。
もう1つの強力な機能は、/v3/session/{sessionId}/generate-pdfエンドポイントを使用して、任意の検証セッションについてコンプライアンス対応のPDFレポートを生成する機能です。これらのPDFには、身元決定、抽出された文書データ、および監査の詳細が含まれており、記録管理と規制遵守を簡素化します。さらに、/v3/session/{sessionId}/decision/エンドポイントを使用すると、ライブネススコア、顔照合結果、現在の処理ステータスなど、完全な検証セッション結果を取得でき、ユーザーの本人確認プロセス全体の全体像を把握できます。
統合の際は、さまざまなAPI応答とステータスを適切に処理することがベストプラクティスです。たとえば、id_verification.statusフィールドは、有効期限切れの文書やライブネスチェックの失敗など、問題が見つかった場合に「Declined」を示すことがあります。これらのステータスに基づいて条件付きロジックを実装することで、アプリケーションが適切に対応できるようになります。これは、ユーザーから追加情報を要求したり、手動レビューのためにケースをエスカレートしたりすることです。Diditの開発者第一のアプローチは、即座のサンドボックスアクセスと公開ドキュメントにより、実験と堅牢な統合の構築を容易にします。
Diditが提供するもの
Diditは、AIネイティブで開発者第一のプラットフォームを通じて、文書データ抽出と本人確認のための比類ないソリューションを提供します。当社の本人確認製品は、高度なOCRを搭載し、世界中の本人確認書類からデータを正確に抽出します。他のプロバイダーとは異なり、Diditは無料のCore KYCを提供しており、初期費用なしで本人確認を開始できます。当社のモジュール式アーキテクチャは、詐欺防止のためのパッシブ&アクティブライブネス、生体認証比較のための1:1顔照合、包括的なチェックのための住所証明など、必要なコンポーネントのみをシームレスに統合できることを意味します。セットアップ費用はかからず、成功したチェックごとの支払いモデルにより、費用対効果が保証されます。Diditを選択することで、グローバルな規模、手動レビューよりも自動化、構造化された本人確認データのために構築されたプラットフォームを活用できます。これらはすべて、クリーンなAPIまたはノーコードのビジネスコンソールを通じてアクセス可能です。
今すぐ始めませんか?
Diditの動作をご覧になりませんか?無料デモを今すぐお試しください。
Diditの無料プランで無料で本人確認を開始しましょう。