4037 articles

WristMIR: 小児尺骨腕 X 線画像の放射学レポート駆動型粗細両層領域感知検索

WristMIR: Coarse-to-Fine Region-Aware Retrieval of Pediatric Wrist Radiographs with Radiology Report-Driven Learning

類似的骨折パターンを持つ腕の X 線画像を検出することは、臨床的に重要な手がかりが微妙であり、非常に局所化され、また重なっている解剖学的構造や変化する撮影角度によってしばしば隠蔽されているため困難です。さらに、ケースベースの医学画像検索用の大規模で高品質に注釈付けされたデータの希少さは、進歩を制限しています。当稿では、密度の高い放射学レポートと骨領域固有の局所化を活用し、手動画像レベルの注釈なしで...

Original: arXiv:2602.07872v1 Announce Type: new Abstract: Retrieving wrist radiographs with analogous fracture patterns is challenging because clinically important cues are subtle, highly localized and often o...

WristMIR: 小児尺骨腕 X 線画像の放射学レポート駆動型粗細両層領域感知検索

インターネット動画からの弱监督による 3D 幾何学基礎モデルのスケーラブルな適応

多言語・音声模型における実用的かつ効率的な量化カライブラートの見直し

VLM はどのプライバシー属性について合意し、どのように正確に予測するか

Specialized Agent Motion Prediction と Generic Agent Motion Prediction を Dynamic Occupancy Grid Maps で統合する

シーン適応のための密度ガイダンスを活用したワンショットの人物数推計

D-ORCA: 会話中心の最適化による頑健な音声視覚キャプション生成

EasyTune: 拡散ベースの動き生成のための効率的なステップ認知微調整

FSP-Diff: フルスペクトル事前情報向上型二領域ラテン拡散による超低線量スペクトル CT 再構成

ニューラル先验を用いた連続性を導くシナergティックな拡散：超スパースビュー CBCT 再構成のための新たなアプローチ

ディープフェイク合成と検出：不均衡な対決

MCIE：空間ガイダンスに裏付けられたマルチモーダル LLM 駆動の複雑な指示に基づく画像編集

ForecastOcc：視覚ベースのセマンティックオキュパンス予報

PhysDrape：明示力と衝突制約による物理的に実質な衣服の褶創学習

FlashVID: Training-free Tree-based Spatiotemporal Token Merging による効率的な動画大規模言語モデル

MIND: World モデルにおける記憶一貫性およびアクション制御のベンチマーク

增強型混合 3D 生成敵対ネットワーク：3D オブジェクトの補完と生成

Vanilla Group Equivariant Vision Transformer: Simple and Effective

Weak to Strong: VLM ベースの仮ラベル付けをマルチモーダルビデオに基づく隠れ感情理解タスクにおける軽微な监督学習戦略として

Picasso: 物理制約付きサンプリングを用いた包括的なシーン再構築