zenn_feed 2026年3月7日

ブラウザだけで完結する日本語OCR＋透視変換（台形補正）を作ってみた

Translated: 2026/3/7 9:20:33

Japanese Translation

はじめにこれまで日本語 OCR について、サーバーサイドで動かす yomitoku を使った Flask + TypeScript 構成や、ブラウザ上で動く Tesseract.js でカスタムモデルをトレーニングする方法を記事にしてきました。今回はブラウザ完結の日本語 OCR をさらに一歩進めて、斜めから撮影した文書画像を4点指定で台形補正してから OCR にかける仕組みを Pure TypeScript で実装しました。本アプリケーションは国立国会図書館が公開している NDLOCR の軽量版をベースにしており、レイアウト認識（DEIMv2）と文字列認識（PARSeq）の ...

ブラウザだけで完結する日本語OCR＋透視変換（台形補正）を作ってみた

Japanese Translation

Original Content