4037 articles

Limited Labels から Open Domains へ：ドローンビュー地位置化のための効率的な学習手法

From Limited Labels to Open Domains:An Efficient Learning Method for Drone-view Geo-Localization

arXiv:2503.07520v5 発表タイプ：置換要約: 従来の監督学習ベースのドローンビュー地位置化（DVGL）手法は、ペアリングされた学習データに大きく依存しており、未paired データからのクロスビュー相関の学習に困難を伴います。さらに、新しいドメインで展開する場合、これらの手法では新しいペアリングデータを取得してモデル適応のために再学習を必要とし、計算オーバーヘッドが大幅に増加しま...

Original: arXiv:2503.07520v5 Announce Type: replace Abstract: Traditional supervised drone-view geo-localization (DVGL) methods heavily depend on paired training data and encounter difficulties in learning cro...

Limited Labels から Open Domains へ：ドローンビュー地位置化のための効率的な学習手法

Scalable Unseen Objects 6-DoF Absolute Pose Estimation with Robotic Integration

文化が交錯する時：多文化テキスト生成画像生成（Multicultural Text-to-Image Generation）

比較研究：合成開口レーダー画像における氷河の崩壊前端の境界線抽出におけるディープラーニング

EventCrab: フレームとポイントのシナジーを活用したエベントベースなアクション認識とそれを超へる

DENALI: 低コスト LiDAR を利用した非直接視線空間推論を可能にするデータセット

MARCH: 人工放射線科医の臨床階層構造を活用した CT レポート生成システム

デュアルモーダル肺癌 AI：臨床リスクを統合した解釈可能な放射線画像と組織顕微鏡学

AEGIS: 知能維持型ビジョン・言語・アクション微調整のためのアンカー制約勾配分離

AstroVLM: 天体画像品質診断のための専門家マルチエージェント協調推理

脆弱データ主体から被害を生むデータ実践へ：プラットフォーム化された人生の AI 分析における保護の矛盾への導航

TwoHamsters: テキストから画像生成モデルにおけるマルチコンセプト構成的な不安全性のベンチマーク

Sub-Saharan Africa データセットにおける脳腫瘍セグメンテーションにおける nnU-Net と MedNeXt のトポロジー駆動型統合による高精度化

Hierarchical Codec Diffusion for Video-to-Speech Generation

TTL: プルーントビジョン・ラングゲージモデルを用いた OOD 検出のためのテスト時テキスト学習

Successor 表現を用いた階層的なアクティブ・インフェレーション

HyperGVL：ハイパーグラフの理解と論理における大規模ビジョン言語モデルのベンチマーク化と改善

GaussianFlow SLAM: モノキュラー高スプラット SLAM を GaussianFlow で誘導

暗闇における適応：ブラックボックスモデルに対する効率的かつ安定したテストタイム適応

CTSCAN: 胸部 CT セグメンテーションにおける評価の漏洩と再現可能な患者間データ共有しないベンチマーク