こんにちは、バクラク事業部AI・機械学習部の飯田 (@frkake) です。 こちらはLayerXアドベントカレンダー1日目の記事です。初日は @izumin5210 さんの記事との二本立てです。 最近、DeepSeek-OCRの登場など、OCR界隈がにわかに活気づいていますね。LLMやVLMの進化に伴い、OCRも単なる「文字起こし」から「構造の読み取り」、さらには「内容の理解」へと進化しているのを感じます。 そこで本記事では、改めてOCR技術の変遷を振り返りつつ、各モデルを自作のサンプルデータを使って検証してみたいと思います。本記事での用語の整理をあらかじめしておきます。 テキスト認識:それがなんの文字であるのかを特定すること。文字起こしを行うこと テキスト検出:文字の位置を検出すること レイアウト認識:画像中の要素の位置や配置を認識すること OCR:画像から文字を書き起こすこと ドキ

SakanaAIは、シリーズBラウンドにおいて、総額約200億円(1億3,500万米ドル)の資金調達を実施しました。これにより、当社のPost-money Valuation(資金調達後企業価値)は約4,000億円(26億3,500万米ドル)に、累計調達額は総額約520億円(3億4,700万米ドル)になります。 既存投資家のMUFG・Khosla Ventures・Lux Capitalに加え、スペインのメガバンクSantander GroupやPalantirへの出資で知られるCIAから派生したVCファームIn-Q-Telなど、世界中の投資家も参加する賑やかなラウンドとなった。どんなに大きくARRを見積もったところで100億円はいかないだろうから、プロダクトが確立されてない状態でPSR40超えという強気のタームシートだったということになる。 SakanaAIといえば、今年2月にわけの

LayerX のバクラク事業部のAI・機械学習部で機械学習エンジニアをしている島越(@nt_4o54)です。こちらはLayerXAI Agent ブログリレー 31 日目の記事です。 昨日は松村 (@yu__ya4)による「Langfuse の Experiment Runner SDK を利用したAI エージェント機能の性能評価と実験管理」でした。 無事にこのブログリレーも日付換算で一ヶ月を突破しました。過去のブログ記事も知見が溢れているので、是非ご覧ください! はじめに LLM 以前の機械学習システムにおけるパーソナライゼーション LLM を用いたシステムにおけるパーソナライゼーション In-Context Learning (ICL): Prompt による動的適応 Prompt の自動最適化 その他の最適化手法 DSPy による Prompt 最適化実践 データセット 推論の

1リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く