Back to list
Disco-RAG:会話構造に敏感な検索拡張生成
Disco-RAG: Discourse-Aware Retrieval-Augmented Generation
Translated: 2026/4/20 11:07:34
Japanese Translation
arXiv:2601.04377v5 Announce Type: replace-cross
要旨:検索拡張生成(RAG)は、知識密度の高いタスクにおける大規模言語モデル(LLM)のパフォーマンス向上において重要な手段として登場しました。しかし、既存の多くの RAG ストラテジーは、検索された段落をフラットかつ構造化されていない方法で扱い、モデルが構造の手がかりを捉えることができず、分散した証拠から知識を統合する能力に制限を課す傾向にあります。これらの制限を克服するため、私たちは会話構造に敏感な フレームワーク「Disco-RAG」を提案しました。Disco-RAG は、生成プロセスに明示的に会話信号を注入します。我々の方法は、局所的な階層構造を捉えるためにチャンク内の会話ツリーを構築し、篇章間の統合作動性をモデル化するための横断的な論理グラフを構築します。これらの構造は、生成を条件付けたプランニング・ブループリントに統合されます。問答処理および長文要約のベンチマークに対する実験は、我々のアプローチの有効性を示しました。Disco-RAG は、ファインチューニングなしにベンチマークにおいて最良の結果を達成しました。これらの発見は、会話構造が RAG システムの進展において果たす重要な役割を示しています。
Original Content
arXiv:2601.04377v5 Announce Type: replace-cross
Abstract: Retrieval-Augmented Generation (RAG) has emerged as an important means of enhancing the performance of large language models (LLMs) in knowledge-intensive tasks. However, most existing RAG strategies treat retrieved passages in a flat and unstructured way, which prevents the model from capturing structural cues and constrains its ability to synthesize knowledge from dispersed evidence across documents. To overcome these limitations, we propose Disco-RAG, a discourse-aware framework that explicitly injects discourse signals into the generation process. Our method constructs intra-chunk discourse trees to capture local hierarchies and builds inter-chunk rhetorical graphs to model cross-passage coherence. These structures are jointly integrated into a planning blueprint that conditions the generation. Experiments on question answering and long-document summarization benchmarks show the efficacy of our approach. Disco-RAG achieves state-of-the-art results on the benchmarks without fine-tuning. These findings underscore the important role of discourse structure in advancing RAG systems.