12673 articles

構造化された輸送帯石炭シーンにおける非構造化な异物异常检测与像素级定位のための多分岐融合および意味的偏異アンカー付け

Semantic-Deviation-Anchored Multi-Branch Fusion for Unsupervised Anomaly Detection and Localization in Unstructured Conveyor-Belt Coal Scenes

arXiv:2602.07694v1 Announce Type: new 要約: 輸送帯石炭シーンにおける信頼性の高い异物异常検出とピクセルレベルの定位は、安全かつ知的な採鉱運営のために不可欠です。このタスクは、石炭と脈石がランダムに積み上げられている、背景が複雑かつ多様な、そして异物が低コントラスト、変形、および被覆を示すために非常に困難です。これらの特性は异物とその周囲が結合しており、構造化...

Original: arXiv:2602.07694v1 Announce Type: new Abstract: Reliable foreign-object anomaly detection and pixel-level localization in conveyor-belt coal scenes are essential for safe and intelligent mining opera...

構造化された輸送帯石炭シーンにおける非構造化な异物异常检测与像素级定位のための多分岐融合および意味的偏異アンカー付け

医療画像セグメンテーションのためのハイブリッド・コルモゴロフ・アルノー・ネットワーク

自律運転のための全光学的セグメンテーション：回折性ニューラルネットワークに基づくアプローチ

PAND：軽量な細粒度視覚分類のためのプロンプト感知近傍蒸留

Rolling Sink：自動回帰型ビデオ拡散モデルにおける有限時間トレーニングと無限時間テストの架け橋

予測安全と飢餓回避制約に基づく確率感知反事実交通信号制御：Vizion ベースセンシングの活用

VideoTemp-o3: エージェント的思考における時間的アンカリングと動画理解の調和

オープンソースの AI 生成画像検出モデルの即座の性能はどの程度か：包括的なベンチマーク研究

ファシアルイメージからの変則的年齢推定：ビジョン言語モデルと従来のアーキテクチャの総合的なベンチマーク比較

物理学への回帰：SMS MRI 再構築のためのオペレータ指導型生成パス

Open-Text Aerial Detection: 航空視覚グウンディングと検出のための統一された枠組み

SPD-Faith ベンチ: 多画像大規模言語モデルの Chain-of-Thought における忠実性の診断と向上

VFace: 訓練を要さない拡散モデルベースのビデオフェイクロスワッピングへのアプローチ

3D 整合性を維持する動画世界モデルのための幾何気配する回転位置埋め込み

超高速運動ブレード画像から 3D 形状の復元

構想による構造の思考：制約された流形上の論推理を通じた空間知能の評価

WristMIR: 小児尺骨腕 X 線画像の放射学レポート駆動型粗細両層領域感知検索

インターネット動画からの弱监督による 3D 幾何学基礎モデルのスケーラブルな適応

多言語・音声模型における実用的かつ効率的な量化カライブラートの見直し

VLM はどのプライバシー属性について合意し、どのように正確に予測するか