導入 こんにちは、株式会社ナレッジセンスの須藤英寿です。 今回は、非構造データから構造データとナレッジグラフを構成して、質問に応じた検索手法を実行することで高い精度を実現する手法「BookRAG」を紹介します。 サマリー RAGはこれまでチャンク化した文書を検索するや、ナレッジグラフを構築して検索する手法など様々な手法が提案されて来ましたが、それぞれ苦手な検索(詳細は後述の課題意識で説明)が存在し精度に限界がありました。 「BookRAG」はツリー構造データとナレッジグラフを組み合わせたうえで、検索に利用可能な処理を11種類作成し、検索時に適切な処理を選択することで高い精度を実現できる手法となっています。 課題意識 既存手法の課題 RAGはこれまで様々な手法が提案されてきましたが、苦手な検索も存在します。 一般的なチャンク化した文書を検索するRAGでは、離れた場所の内容同士の関係性を捉える

© LayerX Inc. 3 LLMとRAG • LLMの制限 ◦ 学習時点で知識が止まっている(カットオフ) ◦ 社内用語や特定ドメインの専門知識がない ◦ 嘘(ハルシネーション)をつく可能性がある • RAG(Retrieval-Augmented Generation) ◦ 外部知識ベースから関連⽂書を検索し、LLMに最新のコンテキストを提供する ◦ リアルタイムで取得された情報を活⽤することで、正確で信頼性の⾼い回答を実現 LLMの制限とRAG © LayerX Inc. 4 LLMとRAG • 従来のRAGの仕組み ◦ ドキュメントをチャンク化し、Embedding(埋め込みベクトル)の類似度で検索する • 弱点 ◦ グローバルな意味構築ができない ▪ 上位数件の情報を取得して回答するため、ドキュメント全体を通して何が⾔えるか?と いう質問に答えられない • 例:「過去10年間

1リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く