12673 articles

MMLSv2：遠隔観測画像における火星地滑の検出のためのマルチモーダルデータセット

MMLSv2: A Multimodal Dataset for Martian Landslide Detection in Remote Sensing Imagery

arXiv:2602.08112v1 発表種別：新規要約：火星表面における地滑のセグメンテーション用データセットである MMLSv2 を提示します。MMLSv2 は RGB、デジタル標高モデル、傾斜、熱慣性、およびグレイスケールチャネルの 7 バンドを含むマルチモーダル画像で構成されています。このデータセットには、トレーニング、検証、テストの分割にわたって分布する 664 枚の画像が含まれていま...

Original: arXiv:2602.08112v1 Announce Type: new Abstract: We present MMLSv2, a dataset for landslide segmentation on Martian surfaces. MMLSv2 consists of multimodal imagery with seven bands: RGB, digital eleva...

MMLSv2：遠隔観測画像における火星地滑の検出のためのマルチモーダルデータセット

パッチベースのトランスフォーマー法を用いた衛星画像による建物被害検出

MambaFusion: 多重モーダル 3D 物体検知のための適応型状態空間融合

世界のフィールド：農地境界の抽出のためのフィールドガイド

分割画像による悪意のある入力攻撃に対する視覚言語モデルの頑健性

DAS-SK: 農業のセマンティックセグメンテーションに適応する二重アトロス可分離および選択核 CNN を統合した軽量モデル

PEGAsus: 幾何形状とアペアーランスの 3D 個人化

生体統計的回帰によるエコー心エコー映像からの左心室駆出分数推定

地理的推論駆動による文脈無視しない遠隔センシングセマンティックセグメンテーション

Chain-of-Caption: 参照表現理解におけるマルチモーダル大規模言語モデルのトレーニングフリー向上

Efficient-SAM2: 物体意識的な視覚エンコーディングとメモリ検索による SAM2 の加速

敵対事的なイベントの生成：モーション感知型ポイントクラウドフレームワーク MA-ADV

When and How Much to Imagine: Adaptive Test-Time Scaling with World Models for Visual Spatial Reasoning

機能的結合を超えた：fMRI による脳障害分類のための時系列モデル

PISCO: スパース制御による正確な動画インスタンス挿入

Tighnari v2: マルチモーダル植物分布予測におけるラベルノイズと分布シフトの緩和: 混合 experts と弱监督和 learnings の活用

CAE-AV: モーダル間相互作用による音視学習の向上

人間動作生成のための言語ガイド付きトランスフォーマートークナイザー

UrbanGraphEmbeddings: スペースに裏付けられたマルチモーダルエンベッディングの学習と評価：都市科学のために

What, Whether and How? Process Reward Models for Thinking with Images Reasoning を解き明かす