Movatterモバイル変換

はてなブックマークアプリ

サクサク読めて、
アプリ限定の機能も多数！

アプリで開く

はてなブックマーク

閉じる

mkusaka id:mkusaka

タグ

関連タグで絞り込む (8)

タグの絞り込みを解除

LayerXとまとめに関するmkusakaのブックマーク (1)

OCR技術の変遷と日本語対応モデルの性能検証 - LayerX エンジニアブログ
こんにちは、バクラク事業部AI・機械学習部の飯田 (@frkake) です。こちらはLayerXアドベントカレンダー1日目の記事です。初日は @izumin5210 さんの記事との二本立てです。最近、DeepSeek-OCRの登場など、OCR界隈がにわかに活気づいていますね。LLMやVLMの進化に伴い、OCRも単なる「文字起こし」から「構造の読み取り」、さらには「内容の理解」へと進化しているのを感じます。そこで本記事では、改めてOCR技術の変遷を振り返りつつ、各モデルを自作のサンプルデータを使って検証してみたいと思います。本記事での用語の整理をあらかじめしておきます。テキスト認識：それがなんの文字であるのかを特定すること。文字起こしを行うことテキスト検出：文字の位置を検出することレイアウト認識：画像中の要素の位置や配置を認識すること OCR：画像から文字を書き起こすことドキ
mkusaka2025/12/01
伝統的OCRからVLMベース最新モデルまで、日本語帳票で精度比較した実践検証
OCR
機械学習
AI
ドキュメント解析
AIエージェント
業務効率化
LayerX
研究
まとめ
あとで読む
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

処理を実行中です

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

はてなブックマーク

公式Twitter

はてなのサービス

Copyright © 2005-2025Hatena. All Rights Reserved.

設定を変更しましたx

[8]ページ先頭

©2009-2025 Movatter.jp