4037 articles

ScatSpotter —— 犬の糞検出用データセット

"ScatSpotter" -- A Dog Poop Detection Dataset

arXiv:2412.16473v2 発表タイプ: 差し替え要約：小さい不規則な廃棄物、例えば排泄物やマイクロプラスチックは、特に混雑したシーンでは見つけることが困難であるが、環境衛生、公衆衛生、および自律的な清掃にとって重要である。我々は「ScatSpotter」を提示する：これは、小型かつ潜在的に隠れる屋外廃棄物のオブジェクト検出およびセグメンテーションシステムのトレーニングと研究のために...

Original: arXiv:2412.16473v2 Announce Type: replace Abstract: Small, amorphous waste objects such as biological droppings and microtrash can be difficult to see, especially in cluttered scenes, yet they matter...

ScatSpotter —— 犬の糞検出用データセット

ERVD: ViT ベースの効率的かつ堅牢な дистillation フレームワーク：遠隔センシング画像検索のため

クラス無視数算に関する調査：参照ベースからオープンワールドテキスト誘導アプローチまでの進展

ImageRAG: 参照指示された画像生成のための動的な画像検索

EgoLife: Egocentric Life Assistant への道

TruthPrInt: Latent Truthful-Guided Pre-Interventionによる大規模ビジョン・言語モデルのオブジェクト嘘偽の軽減

対抗的摩耗と劣化：物理世界における対抗サンプルを生成するため、自然な損傷を活用する

ターゲット不要な LiDAR カメラ補正とニューラルガウススプラッティング

VisionReasoner: レイニンforcing Learning を活用した統一的な推論統合視覚認識

ReaMOT：論理的推論に基づく多オブジェクト追跡のためのベンチマークとフレームワーク

カメラを使わずに NeRF は見ることができますか？

3Dシーンセグメンテーションにおける幾何学増強パラメータ効率化ファインチューニング

MonkeyOCR: 構造認識・関係トリプレットパラダイムによるドキュメント解析

トランスフォーマーベースモデルにおける敵対的ウォーターマークリングの探求：医療画像に対する転移性と防御メカニズムに対する頑健性

ハイシノグラム補完におけるトレーニングフリー推論

イメージフィルタリングとブースティングの知見に基づいて Transformer を再考する

VLMs に対する視覚認識攻撃への本質的な頑健性について

ゲートアテンションと学習可能なサンプリングを用いた大規模マルチモーダルモデルにおける時長動画理解のための状態空間階層圧縮

RealSR-R1: 画像修復における現実世界向け画像超解像度に対するリニアクトルーニングとビジョン言語思考の連鎖

調製と再構築：非整列化されたスマートフォンの視野からハイ퍼스スペクトルイメージングを学習する