GeoFocus: 多模态幾何問題解決における効率的なグローバルからローカルへの変換を融合
GeoFocus: Blending Efficient Global-to-Local Perception for Multimodal Geometry Problem-Solving
arXiv:2602.08524v1 発表タイプ:新
要旨:幾何問題解決は、大型マルチモーダルモデル (LMM) にとって依然として大きな課題であり、単に全体の形状認識だけでなく、幾何学の理論に関連する複雑な局所関係にも注意を払う必要があります。これを解決するために、GeoFocus という新しいフレームワークを提案します。このフレームワークには 2 つの核心的モジュールが含まれています:1) ク...
Original: arXiv:2602.08524v1 Announce Type: new
Abstract: Geometry problem-solving remains a significant challenge for Large Multimodal Models (LMMs), requiring not only global shape recognition but also atten...