Back to list
arxiv_cs_ai 2026年2月10日

学習による選択:クエリに Aware の適応的な次元選択による稠密リtrieval

Learning to Select: Query-Aware Adaptive Dimension Selection for Dense Retrieval

Translated: 2026/2/14 8:17:33

Japanese Translation

稠密検索では、クエリとドキュメントを高次元の埋め込みとして表現しますが、これらの表示には重複要素があるかもしれません:特定の情報ニーズについて、ランクリングで効果的なのは、ある次元のみです。以前の研究は、誤った真の有用性フィードバック(PRF)に基づいて基準の重要性を評価し、これはラッピングされたデータを使用しないプルーツの noisy な偽サインとチュータタイム手順により無意識に頼っています。 一方、監督的なアダプタメソッドは、 relevance サンズのラベルから埋め込み品質を改善するのを助けます。しかし、クエリ間でグローバルな変換が共有されているため、その次元の重要性とは密接に関連づけられていないです。我々は、 extit{学習}によって各サボテンの重要性を直接クエリ埋め込みから予測するQuery-aware適応的な次元選択フレームワークであることを提案しました。我々は最初に监督 relevance のラベルに基づいてのオーウェル 次元的重要な分布を生成し、続いて質問の埋め込みをこれらのラベル分離重視されたスコア指向する予測をトレーニングします。推論時、予測者はクエリの埋め込みに対して変形して選択自己に注意したクエリでのみの次元から類似計算のための最小限の変換群を選択します。多種多様な稠密リtriever およびベンチマーケットの実験により、我々が学習した次元選択者が満足に全次元のベースラインよりもリテリー効果を改善することを見いだすことができます。またパルスの関連性フィードバックメソルドメソッドとシード アダプタベース メソッドのベースも

Original Content

arXiv:2602.03306v2 Announce Type: replace-cross Abstract: Dense retrieval represents queries and documents as high-dimensional embeddings, but these representations can be redundant at the query level: for a given information need, only a subset of dimensions is consistently helpful for ranking. Prior work addresses this via pseudo-relevance feedback (PRF) based dimension importance estimation, which can produce query-aware masks without labeled data but often relies on noisy pseudo signals and heuristic test-time procedures. In contrast, supervised adapter methods leverage relevance labels to improve embedding quality, yet they learn global transformations shared across queries and do not explicitly model query-aware dimension importance. We propose a Query-Aware Adaptive Dimension Selection framework that \emph{learns} to predict per-dimension importance directly from query embedding. We first construct oracle dimension importance distributions over embedding dimensions using supervised relevance labels, and then train a predictor to map a query embedding to these label-distilled importance scores. At inference, the predictor selects a query-aware subset of dimensions for similarity computation based solely on the query embedding, without pseudo-relevance feedback. Experiments across multiple dense retrievers and benchmarks show that our learned dimension selector improves retrieval effectiveness over the full-dimensional baseline as well as PRF-based masking and supervised adapter baselines.