Movatterモバイル変換


[0]ホーム

URL:


はてなブックマークアプリ

サクサク読めて、
アプリ限定の機能も多数!

アプリで開く

はてなブックマーク

  • はてなブックマーク
  • テクノロジー
  • 日本語に特化したOCR、文書画像解析Pythonパッケージ「YomiToku」を公開しました|Kotaro.Kinoshita
  • Twitterでシェア
  • Facebookでシェア

気に入った記事をブックマーク

  • 気に入った記事を保存できます
    保存した記事の一覧は、はてなブックマークで確認・編集ができます
  • 記事を読んだ感想やメモを書き残せます
  • 非公開でブックマークすることもできます
適切な情報に変更

エントリーの編集

loading...

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。

タイトルガイドライン

このページのオーナーなので以下のアクションを実行できます

タイトル、本文などの情報を
再取得することができます
コメントを非表示にできますコメント表示の設定

ブックマークしました

ここにツイート内容が記載されますhttps://b.hatena.ne.jp/URLはspanで囲んでください

Twitterで共有

ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します

1448usersがブックマークコメント73

    ガイドラインをご確認の上、良識あるコメントにご協力ください

    0/0
    入力したタグを追加

    現在プライベートモードです設定を変更する

    おすすめタグタグについて

      よく使うタグ

        日本語に特化したOCR、文書画像解析Pythonパッケージ「YomiToku」を公開しました|Kotaro.Kinoshita

        ガイドラインをご確認の上、良識あるコメントにご協力ください

        0/0
        入力したタグを追加

        現在プライベートモードです設定を変更する

        おすすめタグタグについて

          よく使うタグ

            はてなブックマーク

            はてなブックマークで
            関心をシェアしよう

            みんなの興味と感想が集まることで
            新しい発見や、深堀りがもっと楽しく

            ユーザー登録

            アカウントをお持ちの方はログインページ

            記事へのコメント73

            • 注目コメント
            • 新着コメント
            ublftbo
            たいへん興味深い。使ってみよう。/ 使ってみた。自分の使う(ごちゃごちゃして厄介な)文書対象だと、他のOCRより圧倒的に優秀。すごい。

              その他
              ydf
              レイアウト解析、表解析、読み順推定がスゴイかも。OCRは活字対応で手書きは非対応と思われる。

                その他
                bonita_bonita
                視覚障害者やそのサポート事業者にとっては朗報なのでは

                  その他
                  CffnAddict
                  tesseractとかOCRめんどくさいイメージしかないんだよな〜って一応見てみたら、ただの神が神ツールを公開したという話だった

                    その他
                    asakatana
                    ローカルで動くのはいいな

                    その他
                    ihirokyx
                    ドキュメント解析結果の連携 PDFなどの表のデータからのデータの転記作業の効率化 その他、文書画像からの情報抽出を伴う、作業の半自動化 機密情報が記載された文書画像のローカルサーバー内での解析

                    その他
                    hunglysheep1
                    表の構造をHTMLで再現するの凄いな

                      その他
                      yuumillar
                      kindle本のocr→テキスト化に使ってみたい

                        その他
                        xjack
                        PyTorchとOpenCVを使ってるのね.Hugging Faceからウェイトファイルが自動ダウンロードされる感じ.

                        その他
                        hevohevo
                        ローカルで動く&個人用途無料は大きいな。視覚・聴覚障害者向けの支援にも使えそう。ありがたや。

                          その他
                          nabeshima0924
                          Python

                            その他
                            slack_pulse
                            cliで使えるのがいいな。goのラッパーでも作って使ってみよう

                              その他
                              tmatsuu
                              AIを使ったOCR。「インターネット上で公開されている文書データや合成データを生成し、学習に利用」ほほう

                                その他
                                ite
                                良さそう

                                その他
                                myr
                                すごいというか「へー。。。」を連発しながら読んでた。。色々なものが並行して進化するなぁ

                                  その他
                                  nekotank
                                  日本語特化OCR、すばらしい!個人の検証利用は無料。商用は別途ライセンス必要

                                  その他
                                  IGA-OS
                                  日本語OCR良いな。良い評価が上がっている様子

                                    その他
                                    rizenback000
                                    ついにきたか。使ってみよ。

                                      その他
                                      stabucky
                                      実際に第三者で試した人いないの?

                                        その他
                                        otihateten3510
                                        何者だよ

                                          その他
                                          chago
                                          えー、みてみよ

                                            その他
                                            gmym
                                            作者のTwitterアカウント見に行ったけど開発開始が10月上旬…?マジで?

                                              その他
                                              cpw
                                              これはすごい。使ってみよう。試してみた。エグい。表も起こしてくれるし、画像もちゃんと切り取ってくれる。すごすぎる

                                              その他
                                              kazuhix
                                              政府自治体等のOCR文書のいたるところに散らばってる×選拳○選挙の誤変換を直せるツールがついにできた…のか?

                                                その他
                                                naoto_moroboshi
                                                神やんけ、マジで

                                                  その他
                                                  Galaxy42
                                                  ほほう

                                                  その他
                                                  shimasoba
                                                  透明テキスト付きのPDFに変換できないかなぁ。

                                                    その他
                                                    phyten_obr
                                                    凄すぎる

                                                      その他
                                                      Mabuo_H
                                                      これ例見てるだけでもかなりすごそうだな。。。

                                                        その他
                                                        moonzkk101
                                                        精度の高い文書画像解析は、視覚障害があって音声読み上げを利用している人にも必要な技術。期待したい。

                                                          その他
                                                          andvert
                                                          中華の鉄人かと思いました

                                                            その他
                                                            bayaread
                                                            LLM全盛期のいま、こういう地道な方向で研究活動されてるのには本当に頭が下がる思いだ。すばらしい活動をありがとうございます!

                                                              その他
                                                              OkadaHiroshi
                                                              Google Colab Pro (T4 GPU) で十分動作しました。

                                                                その他
                                                                hiroomi
                                                                何と連携させるかの整備もしておくとよい感じかな。と、今思った。

                                                                  その他
                                                                  cartman0
                                                                  google lensより高性能なんだろうか

                                                                    その他
                                                                    call_me_nots
                                                                    次に残念な表を見たら使ってみる!

                                                                      その他
                                                                      circled
                                                                      日本語、縦書きと横書きが混ざるから辛いんだよね。なお、少し昔の文(江戸、明治)になると横書きも右から左に書き出す場合が発生し出すから死ぬ。古い資料とか辛い

                                                                        その他
                                                                        kusomamma
                                                                        うーん、結局はCUDAでGPUに働いてもらう必要があるとなると、無理にローカルで使えるを目指す必要なくね?と思ってしまう。

                                                                          その他
                                                                          fashi
                                                                          どこかの誰かがちまちま精度上げる研究してるだろう分野をLLMが革新していく様を眺めている

                                                                          その他
                                                                          misshiki
                                                                          “YomiTokuはPDFやカメラで撮影された文書画像を解析するためのPythonパッケージです。”

                                                                          その他

                                                                          注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

                                                                          リンクを埋め込む

                                                                          以下のコードをコピーしてサイトに埋め込むことができます

                                                                          プレビュー
                                                                          アプリのスクリーンショット
                                                                          いまの話題をアプリでチェック!
                                                                          • バナー広告なし
                                                                          • ミュート機能あり
                                                                          • ダークモード搭載
                                                                          アプリをダウンロード

                                                                          関連記事

                                                                            usersに達しました!

                                                                            さんが1番目にブックマークした記事「日本語に特化したO...」が注目されています。

                                                                            気持ちをシェアしよう

                                                                            ツイートする

                                                                            日本語に特化したOCR、文書画像解析Pythonパッケージ「YomiToku」を公開しました|Kotaro.Kinoshita

                                                                            はじめに最近、LLMへのRAGを用いた文書データの連携等を目的に海外を中心にOCRや文書画像解析技術に関連...はじめに最近、LLMへのRAGを用いた文書データの連携等を目的に海外を中心にOCRや文書画像解析技術に関連する新しいサービスが活発にリリースされています。 しかし、その多くは日語をメインターゲットに開発されているわけではありません。日語文書は、英数字に加えて、ひらがな、漢字、記号など数千種類の文字を識別する必要があったり、縦書きなど日語ドキュメント特有のレイアウトに対処する必要があったりと日語特有の難しさがあります。 ですが、今後、海外の開発者がこれらの課題に対処するため、日のドキュメント画像解析に特化したものをリリースする可能性は低く、やはり自国の言語向けのサービスは自国のエンジニアが開発すべきだと筆者は考えています。 もちろん、Azure Document Intelligenceをはじめとした、クラウドサービスのドキュメント解析サービスはありますが、クラウドを利用できないユ

                                                                            ブックマークしたユーザー

                                                                            • mamiyu83222025/12/05mamiyu8322
                                                                            • nabeshima09242025/11/28nabeshima0924
                                                                            • beeworks2025/08/23beeworks
                                                                            • lunar-rear2025/06/21lunar-rear
                                                                            • gungen2025/04/26gungen
                                                                            • nullpobug2025/04/07nullpobug
                                                                            • gkdjgmcnvirgj2025/03/30gkdjgmcnvirgj
                                                                            • slack_pulse2025/03/21slack_pulse
                                                                            • kuroshironeko4792025/03/07kuroshironeko479
                                                                            • BOSEIsan2025/02/27BOSEIsan
                                                                            • hoge2411072025/02/22hoge241107
                                                                            • NATTOMAKI2025/01/28NATTOMAKI
                                                                            • sota3442025/01/22sota344
                                                                            • knzw252024/12/31knzw25
                                                                            • lugecy2024/12/31lugecy
                                                                            • techtech05212024/12/30techtech0521
                                                                            • pipidayooo2024/12/28pipidayooo
                                                                            • fumirin52024/12/28fumirin5
                                                                            すべてのユーザーの
                                                                            詳細を表示します

                                                                            ブックマークしたすべてのユーザー

                                                                            同じサイトの新着

                                                                            同じサイトの新着をもっと読む

                                                                            いま人気の記事

                                                                            いま人気の記事をもっと読む

                                                                            いま人気の記事 - テクノロジー

                                                                            いま人気の記事 - テクノロジーをもっと読む

                                                                            新着記事 - テクノロジー

                                                                            新着記事 - テクノロジーをもっと読む

                                                                            同時期にブックマークされた記事

                                                                            いま人気の記事 - 企業メディア

                                                                            企業メディアをもっと読む

                                                                            はてなブックマーク

                                                                            公式Twitter

                                                                            はてなのサービス

                                                                            • App Storeからダウンロード
                                                                            • Google Playで手に入れよう
                                                                            Copyright © 2005-2025Hatena. All Rights Reserved.
                                                                            設定を変更しましたx

                                                                            [8]ページ先頭

                                                                            ©2009-2025 Movatter.jp