4037 articles

GTAvoidar：リライトとエディタブルなガウスアバターのための、ガウススプラッティングとテクスチャマッピングを繋ぐ

GTAvatar: Bridging Gaussian Splatting and Texture Mapping for Relightable and Editable Gaussian Avatars

arXiv:2512.09162v2 通告タイプ：置換要約：最近のガウススプラッティングの進展は、写真写実的な頭部アバターの再構成をますます正確なものにし、ビジュアルエフェクト、ビデオ会議、仮想実在の多数のアプリケーションへの扉を開いた。しかし、これは従来の三角形メッシュベースの手法が提供する直感的なエディタビリティの欠如を伴う。対照的に、我々は、2 次元ガウススプラッティングの精度と忠実度と...

Original: arXiv:2512.09162v2 Announce Type: replace Abstract: Recent advancements in Gaussian Splatting have enabled increasingly accurate reconstruction of photorealistic head avatars, opening the door to num...

GTAvoidar：リライトとエディタブルなガウスアバターのための、ガウススプラッティングとテクスチャマッピングを繋ぐ

MomaGraph：Vision-Language モデルに基づく状態意識型統一次元グラフによるエンバウディッドタスク計画

ALIGN: LiDAR と画像による高度なクエリ初期化を応用した、不透過物体検出における遮蔽耐性のある 3D 物体検出

Vision Transformers におけるブロック再帰的な動的挙動

SuperiorGAT: スパース化された LiDAR パー・クラウドの再構築のための自律システム用グラフAttentionネットワーク

G2P: ガウスからポイントへの属性一致化に基づく境界感に配慮した 3D セマンティックセグメンテーション

全腹低剂量 PET ノイズ除去における制御された拡散に適用する 3 次元ウェーブレットに基づく構造的先行

Moonworks Lunara Aesthetic Dataset

Vision-Language モデルに対するユニバーサルマルチモーダル攻撃の階層的洗練

SUG-Occ: 現実時間 3D 占有予測のための明示的なセマンティクスと不確実性を導向したスパース学習フレームワーク

人間のシーン理解に一致するメタメアの生成

GO-MLVTON：拡散モデルを用いた衣服不飽和を考慮したマルチレイヤー仮想トライオン

Federated Balanced Learning

ThermoSplat: 機能調節と幾何学的分離を備えたクロスモーダル 3D ギャウジアン Splatter

Visual Prompt-Agnostic Evolution

CAF-Mamba: 多式分解圧症検出のための Mamba ベースクロスモーダル適応的注意融合

Q-Hawkeye: 画像品質評価のための信頼性のある視覚政策最適化

LatentLens: LLM において高度に解釈可能な視覚トークンを明らかにする

Moonworks Lunara Aesthetic II: 文脈整合性に関する画像バリエーションデータの紹介

ReasonEdit: 人間による推論を用いた視覚・言語モデルの編集