Retrieval-Augmented Generation for Large Language Models: A Survey

論文紹介:
大規模言語モデル[LLMs]は幻覚,知識の更新の欠如,透明性やトレーサビリティ欠如といった課題に直面している.これらの課題を克服する有望な方法として浮上しているのが,Retrieval-Augmented Generation[RAG]である.RAGは,こうした課題を外部データベースから知識を取り入れることで克服する有望な方法である.この論文は,RAGの進化を詳細に調査し,ナイーブRAG[Naive RAG],アドバンストRAG[Advanced RAG],モジュラーRAG[Modular RAG]を含む RAG パラダイムの進化について詳細に検討.検索,生成,拡張の手法を含む RAG フレームワークの 3 つの基盤を綿密に精査.
Yunfan Gao, Yun Xiong, Xinyu Gao, Kangxiang Jia, Jinliu Pan, Yuxi Bi, Yi Dai, Jiawei Sun, Meng Wang, Haofen Wang.Retrieval-Augmented Generation for Large Language Models: A Survey.arXiv:2312.10997 [cs.CL]

ナイーブRAG

ナイーブRAGは最も初期のRAG[Retrieval-Augmented Generation]手法であり,Retrieve-Readフレームワークとして知られる.この手法は以下の3つのステップで構成:

ナイーブRAGには以下の欠点がある.

アドバンストRAG

アドバンストRAGナイーブRAGの欠点を克服するために特定の改良を導入.特に検索の質を向上させるために以下の戦略が採用されている.

モジュラーRAG

モジュラーRAGアドバンストRAGのさらなる進化形であり,以下の特徴を有する.


INDEX





















Retrieval-Augmented Generation for Large Language Models: A Survey - 無作為抽出 - 表現学習 - 表現空間 - Map-Reduce