4037 articles

DICE: Diffusion モデルにおけるコントラスト性部分分解を用いた作家スタイルとコンテンツの分離

DICE: Disentangling Artist Style from Content via Contrastive Subspace Decomposition in Diffusion Models

論文: arXiv:2602.08059v1 発表タイプ: new 要約: 最近のディフュージョンモデルの普及により、スタイルの模倣が容易になり、許可なく独自の芸術スタイルを模倣できるようになりました。デプロイされたプラットフォームでは、これは著作権および知的財産のリスクを高め、信頼性の高い保護を求めています。しかし、既存の対策は、新しいスタイルが登場する際に高価な重み編集が必要だったり、明示的...

Original: arXiv:2602.08059v1 Announce Type: new Abstract: The recent proliferation of diffusion models has made style mimicry effortless, enabling users to imitate unique artistic styles without authorization....

DICE: Diffusion モデルにおけるコントラスト性部分分解を用いた作家スタイルとコンテンツの分離

ReRoPE: RoPE を再利用した相対カメラ制御

ViT-5：現代中期の 2020 年代向けヴィジョントランスフォーマー

VidVec: ビデオ MLLM エンベディングの解放によるビデオ・テキスト検索

MMLSv2：遠隔観測画像における火星地滑の検出のためのマルチモーダルデータセット

パッチベースのトランスフォーマー法を用いた衛星画像による建物被害検出

MambaFusion: 多重モーダル 3D 物体検知のための適応型状態空間融合

世界のフィールド：農地境界の抽出のためのフィールドガイド

分割画像による悪意のある入力攻撃に対する視覚言語モデルの頑健性

DAS-SK: 農業のセマンティックセグメンテーションに適応する二重アトロス可分離および選択核 CNN を統合した軽量モデル

PEGAsus: 幾何形状とアペアーランスの 3D 個人化

生体統計的回帰によるエコー心エコー映像からの左心室駆出分数推定

地理的推論駆動による文脈無視しない遠隔センシングセマンティックセグメンテーション

Chain-of-Caption: 参照表現理解におけるマルチモーダル大規模言語モデルのトレーニングフリー向上

Efficient-SAM2: 物体意識的な視覚エンコーディングとメモリ検索による SAM2 の加速

敵対事的なイベントの生成：モーション感知型ポイントクラウドフレームワーク MA-ADV

When and How Much to Imagine: Adaptive Test-Time Scaling with World Models for Visual Spatial Reasoning

機能的結合を超えた：fMRI による脳障害分類のための時系列モデル

PISCO: スパース制御による正確な動画インスタンス挿入

Tighnari v2: マルチモーダル植物分布予測におけるラベルノイズと分布シフトの緩和: 混合 experts と弱监督和 learnings の活用