Mistral AIは2026年6月23日(現地時間)、バウンディングボックス、ブロック分類、インライン信頼度スコアを抽出テキストと共に出力する新OCRモデル「Mistral OCR 4」をリリースした。同モデルは170言語と10の言語グループに対応し、単一コンテナで自己ホスト型デプロイが可能。企業検索、RAG、ドメイン特化型検索パイプラインの取り込みコンポーネントとして利用できる。

Mistral OCR 4は、抽出されたテキストに加え、バウンディングボックス、タイプ別ブロック分類(タイトル、表、数式、署名など)、および単語ごとのインライン信頼度スコアを返す。独立した評価者によるテストでは、主要なOCRおよび文書AIシステムに対し平均72%の勝率を記録し、OlmOCRBenchでは85.20の最高スコアを達成した。

このモデルは、Mistral AIのオープンソース検索フレームワークMistral Search Toolkitの取り込みコンポーネントとして統合されている。PDF、DOC、PPT、OpenDocumentなどの一般的なエンタープライズ形式に対応し、10の言語グループ全体で170言語をサポートする。

OCR 4は単一コンテナで展開できるコンパクトな設計であり、データ主権やコンプライアンス要件を持つ組織向けに、文書データを自社インフラストラクチャ内で保持する完全自己ホスト型デプロイメントをサポートする。API経由での利用は1,000ページあたり4ドルで提供され、バッチAPI割引適用時には1,000ページあたり2ドルに削減される。Document AIは1,000ページあたり5ドルで提供される。

Rogoのエイダン・ドノヒュー氏は、財務QAデータセットにおいて、OCR 4が同等の精度を約8倍低いコストと17倍低い遅延で達成したと述べた。Anaquaのイバン・ミハイロフ氏は、OCR 4が既存プロバイダーに比べて「1ページあたり約4倍高速である」と指摘した。


参考: mistral.ai (アーカイブ) — 2026年6月23日 09:00 (JST)

この記事をシェア
X はてブ LinkedIn