Back to list
AtomicRAG: 検索拡張生成のための原子 - 実体グラフ
AtomicRAG: Atom-Entity Graphs for Retrieval-Augmented Generation
Translated: 2026/4/24 20:19:12
Japanese Translation
arXiv:2604.20844v1 発表タイプ: cross
要約: 最近の GraphRAG 手法は、知識グラフの三項関係をテキストチャンクをつなぐことで検索の網羅性と精度を向上させます。しかし、テキストチャンクを知識表現の基本単位と厳格に扱うことは、複数の原子的事実を一緒にグループ化し、多様な検索シナリオに対応するための柔軟性と適応性を制限します。さらに、三項に基づいた実体リンク付けは関係抽出のミスに敏感であり、それが欠落したり誤ったたり推論経路を引き起こすことがあり、最終的に検索精度を低下させます。これらの問題に対処するために、私達はあるほど正確で信頼性の高い知識表現およびインデックス構成を提案する原子 - 実体グラフ (Atom-Entity Graph) を提案します。私達のアプローチでは、知識は粗粒度のテキストチャンクではなく、個別の自己完結的な事実情報単位である知識原子 (knowledge atoms) として保存されます。これにより、知識要素は互いに干渉することなく柔軟に再組立され、多様なクエリの観点とシームレスに一致できるようになります。実体間のエッジは単に関係が存在するかを示すだけです。個人ページランクと関連性ベースのフィルタリングを組み合わせることで、正確な実体接続を維持し、推論の信頼性を向上させます。理論的分析および 5 つの公共ベンチマーク上の実験は、提案された AtomicRAG アルゴリズムが検索精度と推論の頑健性において、強力な RAG ベースラインを上回っていることを示しています。コード: https://github.com/7HHHHH/AtomicRAG.
Original Content
arXiv:2604.20844v1 Announce Type: cross
Abstract: Recent GraphRAG methods integrate graph structures into text indexing and retrieval, using knowledge graph triples to connect text chunks, thereby improving retrieval coverage and precision. However, we observe that treating text chunks as the basic unit of knowledge representation rigidly groups multiple atomic facts together, limiting the flexibility and adaptability needed to support diverse retrieval scenarios. Additionally, triple-based entity linking is sensitive to relation-extraction errors, which can lead to missing or incorrect reasoning paths and ultimately hurt retrieval accuracy. To address these issues, we propose the Atom-Entity Graph, a more precise and reliable architecture for knowledge representation and indexing. In our approach, knowledge is stored as knowledge atoms, namely individual, self-contained units of factual information, rather than coarse-grained text chunks. This allows knowledge elements to be flexibly reassembled without mutual interference, thereby enabling seamless alignment with diverse query perspectives. Edges between entities simply indicate whether a relationship exists. By combining personalized PageRank with relevance-based filtering, we maintain accurate entity connections and improve the reliability of reasoning. Theoretical analysis and experiments on five public benchmarks show that the proposed AtomicRAG algorithm outperforms strong RAG baselines in retrieval accuracy and reasoning robustness. Code: https://github.com/7HHHHH/AtomicRAG.