Back to list
自動的に多言語大規模言語モデルのQuery Expansionと並行した二種類の大規模言語モデルによるRefinement
Automatic In-Domain Exemplar Construction and LLM-Based Refinement of Multi-LLM Expansions for Query Expansion
Translated: 2026/3/7 14:19:45
Japanese Translation
Queryの拡張は、大規模言語モデルを使った手法は有用ですが、よく選び抜かれたプロンプトや手動で選ばれたエクスマラルもしくは単一の大規模言語モデルを頻繁に使用していることが多く、それ自体が非スケーリブルです。また、ドメイン間の変化に対して敏感であるという欠点もあります。我々は、自動的にドメイン対応のQuery Expansion専用フレームワークを開発し、Drift- Aware Cluster Strategyによりドメイン内の関連パスグゲスを採用することで、手作業で選定されたエクスマラルやBM25と並行してMonoT5 Pipelineを使用するためのドメイン対応のエクスマラルプールを作り出します。また、ドメイン間の変化に対して強固な安定したContextからの基になるQuery Expansionを達成するためにCluster選択戦略を使って手助けします。その後、We present a two-LLM Ensembleで二種類のハイペンヘリティグ大規模言語モデルを使用して独立的にエクスマラルを生成し、Refinementされた一貫性のあるエクスマラルを作り出しました。最終的な結果はTREC DL20、DBPedia、SciFact等のデータセットを使って評価され、リファイン構成がBM25、Rocchio、ゼロショット型の基になるベースラインと比較して効果的に統計学的に得点を向上させることに成功しました。このフレームワークは、ドメイン内の質と多様性のエクスマラル選択と二種類の大規模言語モデルからのエクスマラルの生成において使用できる再現可能なテストブランクであり、Label-Free型のQuery Expansionの実際の環境に対する適切なソリューションを提供します。
Original Content
arXiv:2602.08917v1 Announce Type: cross
Abstract: Query expansion with large language models is promising but often relies on hand-crafted prompts, manually chosen exemplars, or a single LLM, making it non-scalable and sensitive to domain shift. We present an automated, domain-adaptive QE framework that builds in-domain exemplar pools by harvesting pseudo-relevant passages using a BM25-MonoT5 pipeline. A training-free cluster-based strategy selects diverse demonstrations, yielding strong and stable in-context QE without supervision. To further exploit model complementarity, we introduce a two-LLM ensemble in which two heterogeneous LLMs independently generate expansions and a refinement LLM consolidates them into one coherent expansion. Across TREC DL20, DBPedia, and SciFact, the refined ensemble delivers consistent and statistically significant gains over BM25, Rocchio, zero-shot, and fixed few-shot baselines. The framework offers a reproducible testbed for exemplar selection and multi-LLM generation, and a practical, label-free solution for real-world QE.