SmartMatch OCR
新機能 · Target Profile v1 — 一度定義すれば、どこでも抽出

生の OCR を
業務で使える監査済みデータへ。

Google Document AI に重ねる精度保証レイヤー。Target Profile を定義するだけで、抽出・根拠付き検証・二者レビューを 1 つの API で完結します。

二重チェック必須根拠付き · bbox とコンテキスト不変な Target Profile バージョン完全な監査ログ
ソース文書AI 検証完了

検査報告書

発行日:2024年05月20日
患者ID12345678
氏名山田 太郎 様
性別男 年齢:56歳
検査日2024年05月18日
医療機関スマートメディカルクリニック
血液検査
検査項目検査結果基準値単位
白血球数6,2503,300 - 8,600/µL
赤血球数480430 - 570万/µL
ヘモグロビン13.213.5 - 17.6g/dL
ヘマトクリット39.140.0 - 52.0%
血小板数21.315.8 - 34.8万/µL
生化学検査
検査項目検査結果基準値単位
AST (GOT)2313 - 30U/L
ALT (GPT)4510 - 42U/L
γ-GTP3210 - 60U/L
クレアチニン1.210.65 - 1.09mg/dL
eGFR58.760 以上mL/min/1.73㎡
血糖 (空腹時)10270 - 109mg/dL
所見

特記すべき異常は認められません。今後も定期的な経過観察を推奨します。

smartmatch
AI 検証完了
13.2g/dL
信頼度98.7%
smartmatch
AI 検証完了
45U/L
信頼度98.4%
smartmatch
AI 検証完了
1.21mg/dL
信頼度98.9%
なぜ SmartMatch

あらゆる Document AI の前に置ける、精度保証レイヤー。

外部 OCR はあくまでエンジンであり、真実の源泉ではありません。SmartMatch が判断、根拠、そして監査証跡を追加することで、自動抽出を本番環境でも安全に利用できる仕組みにします。

固定スキーマではなく Target Profile

プロジェクトごとに「何を取り出すか」を宣言します — フィールド、同義語、アンカー、構造ルール。バージョンは不変で、すべての抽出が再現可能で監査可能です。

根拠付きの位置特定とマッチング

OCR のテキストにとどまりません。SmartMatch はターゲットごとにページ上を探索し、バウンディングボックス、ページ番号、周辺コンテキスト付きの候補を返します。

ルールベースの正規化と検証

型、フォーマット、範囲、フィールド間整合性、禁止パターンを決定論的に適用。Document AI の上に重ねて、フィールドごとの理由コード付きで返します。

Human-in-the-Loop と二重チェック

REVIEW_REQUIRED の項目は一次レビュアー、続いて二次承認者(別ユーザーが必須)へ。スーパーバイザーが不一致を解消します。

Finalized のみ外部出力

中間結果はシステムの外に出ません。project_id と target_profile_version に紐づく Finalized 状態のドキュメントだけが API 経由で公開されます。

完全かつ不変な監査証跡

状態遷移、ルールバージョン、人による判断のすべてが追記専用で記録されます。なぜその値が確定したのか、誰がそうしたのかを正確に説明できます。

パイプライン

アップロードから Finalized までの決定論的な状態機械。

すべてのドキュメントは明示的で監査可能な状態の連鎖を経由します。不正な遷移は API 層で拒否されます。

  1. 1
    Uploaded
    アップロード

    PDF または画像。複数ページ対応。

  2. 2
    Prechecked
    事前チェック

    解像度、ぶれ、欠損、位置特定可能性。

  3. 3
    AIProcessed
    外部 AI

    Google Document AI による OCR と構造化。

  4. 4
    Interpreted
    位置特定 / マッチング

    Target Profile × OCR → 候補と根拠。

  5. 5
    Validated
    検証

    正規化、型 / 範囲チェック、スコアリング。

  6. 6
    Reviewed → Approved
    HITL レビュー

    必要に応じて二者によるダブルチェック。

  7. 7
    Finalized
    確定

    Finalized のデータのみ API 経由で公開。

仕組み

4 つのプリミティブ。予測可能な 1 つのフロー。

01

Target Profile を作成

抽出したいフィールドキー、想定する型、同義語、アンカー語、マッチングルールを宣言します。バージョンは公開後不変です。

POST /v1/projects/{project_id}/target-profiles
POST /v1/target-profiles/{profile_id}/versions
02

ドキュメントをアップロード

project と target_profile_version に紐づく Document コンテナを作成。ページを追加するか PDF をアップロードすると、SmartMatch がページ分割を行います。

POST /v1/documents
POST /v1/documents/{document_id}/upload-pdf
03

OCR · 位置特定 · 検証を実行

Document AI を起動した後、SmartMatch が候補を位置特定し、正規化し、ルールに対して検証します。すべて非同期です。

POST /v1/documents/{document_id}/ai-jobs
POST /v1/documents/{document_id}/validate
04

レビュー · 承認 · 確定

REVIEW_REQUIRED の項目は HITL へ。二番目の承認者(別ユーザー)がダブルチェックします。Finalized のデータのみ後段システムへ返されます。

POST /v1/documents/{document_id}/reviews
POST /v1/documents/{document_id}/approvals
GET  /v1/documents/{document_id}/final

OCR パイプラインに説明責任を。

あなたのドキュメントセットと Target Profile を使って SmartMatch をパイロット導入できます。プロファイル設計、ルールチューニング、最初のダブルチェックワークフローまで一緒に伴走します。