4037 articles

カオサル・ブートストラップ化されたアライメント：無監督動画ベースの可視・赤外線 Person Re-Identification

Causal Bootstrapped Alignment for Unsupervised Video-Based Visible-Infrared Person Re-Identification

arXiv:2604.15631v1 Announce Type: new 摘要：全日監視において、時間情報は静的画像の情報を超える追加の示唆を提供する重要な手法である VVI-ReID です。しかし、既存のアプローチは高価なクロスモーダルアノテーションを前提とする完全な监督学習に依存しており、スケーラビリティの限界があります。この問題を解決するために、我々はラベルなし動画トラックレットから直接...

Original: arXiv:2604.15631v1 Announce Type: new Abstract: VVI-ReID is a critical technique for all-day surveillance, where temporal information provides additional cues beyond static images. However, existing ...

カオサル・ブートストラップ化されたアライメント：無監督動画ベースの可視・赤外線 Person Re-Identification

SIMMER：MLLM ベースのエンベッディングを用いたクロスモーダリティ食事画像からレシピへの検索

AdaVFM: LLM に案内された実行を介したエッジ知能のための適応型ビジョンファウンデーションモデル

CLIMB: Mamba ベースの潜在拡散モデルと高斯準同化エンコーダを用いた制御可能な長期的脳画像生成

CXR-LT 2026 チャレンジ：複数センターの長尾分布およびゼロショット胸 X 線分類

UA-Net: TRISO 画像の半導体分割に適用される不確実性認識ネットワーク

High-Quality Image Generation のための Frequency-Aware Flow Matching

(1D) オーダリングトークンによる効率良いテストタイム検索

Weak-to-Strong Knowledge Distillation: 強力学習モデルのトレーニングを加速する

ズーム一貫性：マルチステップビジュアルグラウンディングパイプラインにおける無料の信頼度シグナル

POP: Prefill-Only Pruning for Efficient Large Model Inference

LLMOrbit: 大規模言語モデルの円形分類体系 - スケーリングの壁からエージェント AI システムまで

暗記から創造性まで：LLM が新しいニューラルアーキテクチャを設計する

合成超音波画像拡張に強化された連合 Breast Cancer 検出

KnowRL: 事実性を追求する知識を活用した強化学習に関する探索

Transformer 型アーキテクチャを用いた前立腺腺体分割の精度向上

拡散モデルの診断と改善における最適な損失値の推定

データや最適化なしにおける最大脳損傷：符号ビットのフリップによるニューラルネットワークの破壊

cine MRI におけるフレーム予測と PCA 呼吸運動モデル：オンラインでトレーニングされた再帰ニューラルネットワークとトランスフォーマーの比較

PDF-GS: 頑健な 3D ガウススポットリングのための段階的妨害フィルタリング