
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
ここにツイート内容が記載されますhttps://b.hatena.ne.jp/URLはspanで囲んでください
Twitterで共有ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

💡 意外な落とし穴:コストの逆転現象 「RAGの方が安い」と一般に言われますが、大規模運用時は注意が必...💡 意外な落とし穴:コストの逆転現象 「RAGの方が安い」と一般に言われますが、大規模運用時は注意が必要です。 RAG は毎回大量のドキュメントをプロンプトに含めるため、入力トークン課金 が嵩みます。一方、Fine-tuning 済みのモデルは「質問」だけで答えられるため、トークン消費は最小限です。 月間数百万リクエストを超えるようなケースでは、Fine-tuning の方がトータルコストが安くなる分岐点が存在します。 Use Cases ( ケース別判断フロー ) どちらを採用すべきか迷ったときは、以下のフローチャートに従ってください。 Case 1: RAG を選ぶべきシーン 情報の鮮度が命: ニュース、株価、社内の日報、製品在庫など、分単位・日単位で変わる情報。 根拠の提示が必要: 「マニュアルの〇ページに書いてあります」という引用が必要な場合。 データ量が膨大: 数GB〜TB級の