Back to list
ブラウザだけで完結する日本語OCR+透視変換(台形補正)を作ってみた
ブラウザだけで完結する日本語OCR+透視変換(台形補正)を作ってみた
Translated: 2026/3/7 9:20:33
Japanese Translation
はじめに
これまで日本語 OCR について、サーバーサイドで動かす yomitoku を使った Flask + TypeScript 構成や、ブラウザ上で動く Tesseract.js でカスタムモデルをトレーニングする方法を記事にしてきました。
今回は ブラウザ完結の日本語 OCR をさらに一歩進めて、斜めから撮影した文書画像を4点指定で台形補正してから OCR にかける仕組みを Pure TypeScript で実装しました。
本アプリケーションは国立国会図書館が公開している NDLOCR の軽量版をベースにしており、レイアウト認識(DEIMv2)と文字列認識(PARSeq)の ...
Original Content
はじめに
これまで日本語 OCR について、サーバーサイドで動かす yomitoku を使った Flask + TypeScript 構成や、ブラウザ上で動く Tesseract.js でカスタムモデルをトレーニングする方法を記事にしてきました。
今回は ブラウザ完結の日本語 OCR をさらに一歩進めて、斜めから撮影した文書画像を4点指定で台形補正してから OCR にかける仕組みを Pure TypeScript で実装しました。
本アプリケーションは国立国会図書館が公開している NDLOCR の軽量版をベースにしており、レイアウト認識(DEIMv2)と文字列認識(PARSeq)の ...