Back to list
Geo-R1: 少ショット地上参照表現の理解を強化学習で改善する
Geo-R1: Improving Few-Shot Geospatial Referring Expression Understanding with Reinforcement Fine-Tuning
Translated: 2026/4/24 19:49:53
Japanese Translation
arXiv:2509.21976v3 Announce Type: replace
Abstract: リモートセンシングにおける参照表現の理解は、複雑なオブジェクトと文脈の関係性について論理的思考を要するため、独自の課題をもたらします。マルチモーダル大規模言語モデルに対する有监督微调(SFT)は大量のラベル付きデータセットで強力な性能を発揮しますが、データが少ないシナリオでは困難に陥り、一般化能力が低下します。この限界を克服するために、我々は Geo-R1 という提案しました。Geo-R1 は、少ショット地上参照表現のために、中心的な論理的思考指向の強化学習(RFT)パラダイムです。Geo-R1 は、モデルが参照表現を分解する明示的で解釈可能な論理推理チェーンを生成することを先決とし、その後にこれらの根拠を活用して対象オブジェクトを位置付けるように強要します。この「まず推理し、次に行動する」プロセスは、モデルが限られた注釈をより効果的に使用することを可能にし、一般化能力を向上させ、かつ解釈性を提供します。我々は、慎重に設計された 3 つの少ショット地上参照表現ベンチマークで Geo-R1 を検証し、我々のモデルは SFT ベースラインに対して一貫性かつ顕著に優れた結果を示しました。また、強固なクロスデータセットの一般化能力を示しており、その耐久性を証明しています。コードとデータは以下に公開されます:https://github.com/Geo-R1/geo-r1
Original Content
arXiv:2509.21976v3 Announce Type: replace
Abstract: Referring expression understanding in remote sensing poses unique challenges, as it requires reasoning over complex object-context relationships. While supervised fine-tuning (SFT) on multimodal large language models achieves strong performance with massive labeled datasets, they struggle in data-scarce scenarios, leading to poor generalization. To address this limitation, we propose Geo-R1, a reasoning-centric reinforcement fine-tuning (RFT) paradigm for few-shot geospatial referring. Geo-R1 enforces the model to first generate explicit, interpretable reasoning chains that decompose referring expressions, and then leverage these rationales to localize target objects. This "reason first, then act" process enables the model to make more effective use of limited annotations, enhances generalization, and provides interpretability. We validate Geo-R1 on three carefully designed few-shot geospatial referring benchmarks, where our model consistently and substantially outperforms SFT baselines. It also demonstrates strong cross-dataset generalization, highlighting its robustness. Code and data will be released at: https://github.com/Geo-R1/geo-r1.