Back to list
Materialistic RIR: マテリアルコンディショニングされたリアリティある RIR 生成
Materialistic RIR: Material Conditioned Realistic RIR Generation
Translated: 2026/4/24 19:41:19
Japanese Translation
arXiv:2604.21119v1 Announce Type: new
Abstract: 「金の響き、木の打ち音!」私たちは環境で聞こえる音が、空間的なレイアウトだけでなく、その内にある物体や表面の素材によって形成されていることを知っています。例えば、木造の壁がある部屋と、同じ空間的レイアウトを持ちながらコンクリートの壁がある部屋は、異なる音響体験を生み出します。これらの効果を正確にモデル化することは、仮想リアリティ、ロボティクス、建築設計、音響エンジニアリングといったアプリケーションにおいて不可欠です。しかし、既存の音響モデリング手法は、しばしば空間的要素と素材的な要素を相関を持つ表現の中で絡み合い、ユーザーの制御を制限し、生成された音響のリアリティを低下させています。本研究では、空間と素材のクイースを明示的に分離する革新的な部屋インパルス応答(RIR)生成アプローチを提案します。私たちのアプローチは、2 つのモジュールを用いて RIR をモデル化しています:1 つは空間的レイアウトの影響を捉える空間モジュール、もう 1 つはユーザーが指定した素材構成に応じてこの空間 RIR を変調する素材モジュールです。この明示的な分離設計により、ユーザーは空間構造やシーン内容を変更せずに、シートの素材構成を容易に変更し、それが音響に与える影響を観察することができます。私たちのモデルは、音響ベースの指標(RTE で最大 +16% の改善)および素材ベースの指標(最大 +70% の改善)において、既往のアプローチに大きな改善をもたらしました。さらに、人間の知覚研究を通じて、私たちのモデルが強力なベースラインよりも向上したリアリティと素材感度であることを示しました。
Original Content
arXiv:2604.21119v1 Announce Type: new
Abstract: Rings like gold, thuds like wood! The sound we hear in a scene is shaped not only by the spatial layout of the environment but also by the materials of the objects and surfaces within it. For instance, a room with wooden walls will produce a different acoustic experience from a room with the same spatial layout but concrete walls. Accurately modeling these effects is essential for applications such as virtual reality, robotics, architectural design, and audio engineering. Yet, existing methods for acoustic modeling often entangle spatial and material influences in correlated representations, which limits user control and reduces the realism of the generated acoustics. In this work, we present a novel approach for material-controlled Room Impulse Response (RIR) generation that explicitly disentangles the effects of spatial and material cues in a scene. Our approach models the RIR using two modules: a spatial module that captures the influence of the spatial layout of the scene, and a material module that modulates this spatial RIR according to a user-specified material configuration. This explicitly disentangled design allows users to easily modify the material configuration of a scene and observe its impact on acoustics without altering the spatial structure or scene content. Our model provides significant improvements over prior approaches on both acoustic-based metrics (up to +16% on RTE) and material-based metrics (up to +70%). Furthermore, through a human perceptual study, we demonstrate the improved realism and material sensitivity of our model compared to the strongest baselines.