12673 articles

arxiv_cs_cv 2026/2/10

スプリッド・テンポラル推定のための、畳み込みのみからなるニューラルネットワークを用いた相場シミュレーションへの拡張

Towards Spatio-Temporal Extrapolation of Phase-Field Simulations with Convolution-Only Neural Networks

arXiv:2601.04510v2 Announce Type: replace-cross 本文書では、金属合金化(LMD)の相場シミュレーションにおいて、複雑な微細構造進化を捉えられる一方で、大規模な領域や長期間のシミュレーションではコストがかさんで高価になるという課題に対処します。本稿では、データトレーニング範囲を空間・時間ともに大幅に超える外推能力を持つ、完全に畳み込み型かつ条件付パラメ...

Original: arXiv:2601.04510v2 Announce Type: replace-cross Abstract: Phase-field simulations of liquid metal dealloying (LMD) can capture complex microstructural evolutions but can be prohibitively expensive fo...

arxiv_cs_cv 2026/2/10

W-DUALMINE: 信頼性を重み付けた双専門家融合法と残差相関維持を用いた医学画像融合

W-DUALMINE: Reliability-Weighted Dual-Expert Fusion With Residual Correlation Preservation for Medical Image Fusion

arXiv:2601.08920v2 Announce Type: replace-cross Abstract: 医学画像融合は、複数の画像モードから補完的な情報を統合し、臨床的解釈を改善します。しかし、既存のディープラーニングベースの手法、包括的に最近の空間-周波数フレームワーク(例:AdaFuse や ASFE-Fusion)は、相関係数(CC)や相互情報量(MI)で測定されるグローバルな統...

Original: arXiv:2601.08920v2 Announce Type: replace-cross Abstract: Medical image fusion integrates complementary information from multiple imaging modalities to improve clinical interpretation. However, exist...

arxiv_cs_cv 2026/2/10

MACD:反事例データを用いたモデル意識的な対比型デコーディング

MACD: Model-Aware Contrastive Decoding via Counterfactual Data

arXiv:2602.01740v2 Announce Type: replace-cross 摘要:ビデオ言語モデル(Video-LLMs)は、視覚的証拠が弱く、曖昧、または偏っている場合に、合理的だが根拠のないコンテンツを生成する幻覚(hallucination)に陥りがちです。既存のデコーディング手法(例えば対比型デコーディング:Contrastive Decoding(CD))は、幻覚パタ...

Original: arXiv:2602.01740v2 Announce Type: replace-cross Abstract: Video language models (Video-LLMs) are prone to hallucinations, often generating plausible but ungrounded content when visual evidence is wea...

arxiv_cs_cv 2026/2/10

Time Is All It Takes: Spike-Retiming Attacks on Event-Driven Spiking Neural Networks

arXiv:2602.03284v2 Announce Type: replace-cross Abstract: スパイキング神経ネットワーク(SNN)は離散のスパイキングを用いて計算し、時系列構造を活用しますが、多くの対抗手続は強度やイベントの数を変えており、タイミング自体を変えません。本研究では、既存のスパイキングのタイミングだけを変えて、スプライキング数と振幅を保ち、イベント駆動型 SN...

Original: arXiv:2602.03284v2 Announce Type: replace-cross Abstract: Spiking neural networks (SNNs) compute with discrete spikes and exploit temporal structure, yet most adversarial attacks change intensities o...

arxiv_cs_cv 2026/2/10

非滑らかな要素は Vision Transformer のフィニュートニングに有利となる

Vision Transformer Finetuning Benefits from Non-Smooth Components

arXiv:2602.06883v2 Announce Type: replace-cross 摘要:トランスフォーマーアーキテクチャの滑らかさ(smoothness)は、汎化能力、トレーニング安定性、および对抗性頑健性といった文脈で広く研究されてきた。しかし、転移学習におけるその役割は十分には理解されていない。本論文では、ビジョントランスフォーマーのコンポーネントが入力変化に対して出力を適応させ...

Original: arXiv:2602.06883v2 Announce Type: replace-cross Abstract: The smoothness of the transformer architecture has been extensively studied in the context of generalization, training stability, and adversa...

arxiv_cs_gr 2026/2/10

凸包素u形分解の碰撞デテクタ

Convex Primitive Decomposition for Collision Detection

3Dモデルに碰撞対象を生成する作業は、モデラーがボイドボックスやカプセルや spherical プライ Primitiveなどから複雑なメッシュを近似するためにマニュアルでプリントが必要です。 見当のつかない_convex分解は、3Dモデルに凸包のクィッドリーゼメッシュを使用して実装し、ゲームのような限られたパフォーマンス要因向けに実用的ではありません。 増大した碰撞デテクトと、出力への直接の変更...

Original: arXiv:2602.07369v1 Announce Type: new Abstract: Creation of collision objects for 3D models is a time-consuming task, requiring modelers to manually place primitives such as bounding boxes, capsules,...

arxiv_cs_gr 2026/2/10

低ランクコープバンオペレーターによる変形態の高速化・デフォルメスラブシミュレーション

Low-Rank Koopman Deformables with Log-Linear Time Integration

我々は、コープバンオペレータ用の低ランク形式を提案し、可変性の多いダイナミックシミュレーションを加速する方法です。コープバンオペレーターのパラメトリゼーションとしてのディオニム模式(DMD)を使用することで、この手法は時間的変化のデフォルメンダイナミクスと未来状態予測を学びます。それには、通常の時間シーケンシャル計算よりも効率的な行列評価が使用され、時刻ステップ数に対してログ線形なスケーリングが達...

Original: arXiv:2602.07687v1 Announce Type: new Abstract: We present a low-rank Koopman operator formulation for accelerating deformable subspace simulation. Using a Dynamic Mode Decomposition (DMD) parameteri...

arxiv_cs_gr 2026/2/10

TABI: 組み詰めがきとバランスの取れたインタラクティブな地図セット

TABI: Tight and Balanced Interactive Atlas Packing

アトス(ATLAS)の組み詰めは、多くのコンピュータグラフィックスアプリケーションにおいて重要なステップです。アトスの最適化アルゴリズムは、固定サイズのアトス内で可能な限り少ないダウンサンプリングでチャートを配置します。コンテンツ作成ツールやビデオゲーム用の動的アトス生成、テクスチャ空間シレネなど、多くのアプリケーションにはオンザフライインタラクティブなアトス組み詰めが要求されます。不幸にもいくつ...

Original: arXiv:2602.07782v1 Announce Type: new Abstract: Atlas packing is a key step in many computer graphics applications. Packing algorithms seek to arrange a set of charts within a fixed-size atlas with a...

arxiv_cs_gr 2026/2/10

MPM Lite:直線なカーネルと統合で、粒子を使わずに

MPM Lite: Linear Kernels and Integration without Particles

arXiv:2602.07853v1 新刊種:new 摘要:この論文では,私たちが新規のハイブリッド ラグランジュ/エオリアング方法「MPM Lite」を紹介します。この方法によって、計算時に行っている粒子ベースの積分が必要なくなりました。通常のMPMの運用においては、積分時に高価な直直解の実装が粒子密度ごとに増えるためパフォーマンス上にネックとなり、粒子ベースの積分区数PPCと組み合わされていま...

Original: arXiv:2602.07853v1 Announce Type: new Abstract: In this paper, we introduce MPM Lite, a new hybrid Lagrangian/Eulerian method that eliminates the need for particle-based quadrature at solve time. Sta...

arxiv_cs_gr 2026/2/10

エネルギー制御可能な時積分で動的シミュレーション: 弾性体

Energy-Controllable Time Integration for Elastodynamic Contact

Original: arXiv:2602.08094v1 Announce Type: new Abstract: Dynamic simulation of elastic bodies is a longstanding task in engineering and computer graphics. In graphics, numerical integrators like implicit Eule...

arxiv_cs_gr 2026/2/10

Superresolutionを忘れて、適応的サンプリング (パストレース)

Forget Superresolution, Sample Adaptively (when Path Tracing)

実時間のパストレースは、収集量が一ピクセル当たり1サンプル以下にまで極めて低くなるように動作すること increasinglyなおり、そしてこれらの理由により、レンダリングの複雑さ、解像度とフレームレートの要件がますます増大しています。 超解像はプロデュースで広く利用されていますが、これを全てのスパースなルーチンにおいて空間的な詳細性を無視し、画像全体で騒音、再構築し難さおよび心理的な重要性的さと...

Original: arXiv:2602.08642v1 Announce Type: new Abstract: Real-time path tracing increasingly operates under extremely low sampling budgets, often below one sample per pixel, as rendering complexity, resolutio...

arxiv_cs_gr 2026/2/10

大規模生成された実感できる擬似的家庭データ

Realistic Synthetic Household Data Generation at Scale

先進的な基礎モデルの発展により、体験型AIを開発する研究が推進されています。これにより、環境に類似した思考を伴った交互作用を持つ操作可能な代理人を産み出すことが可能になります。 これらの代理人体験するには大量の大規模データセットが必要です。以前のフレームワークは長期的な人ロボット交渉での擬似的なデータ生成を用いますけど、その反対の影響も含めた人間行動と家庭環境のモデル化に失敗しています。我々が提案...

Original: arXiv:2602.07243v1 Announce Type: cross Abstract: Advancements in foundation models have catalyzed research in Embodied AI to develop interactive agents capable of environmental reasoning and interac...

arxiv_cs_gr 2026/2/10

T2VTree:ユーザー中心の視覚解析を用いた代理制による思想からビデオ生成

T2VTree: User-Centered Visual Analytics for Agent-Assisted Thought-to-Video Authoring

Original: arXiv:2602.08368v1 Announce Type: cross Abstract: Generative models have substantially expanded video generation capabilities, yet practical thought-to-video creation remains a multi-stage, multi-mod...

arxiv_cs_gr 2026/2/10

PBR Inspirationインスピレートされた可制御散乱のPipeline for画像生成

PBR-Inspired Controllable Diffusion for Image Generation

要約:テキストをイメージに導くのは最近になって進歩しましたが、合成シーン中の幾何学的レイアウトとPBR素材特性をコントロールするのは困難です。我々はまずテキストの提示からグリッガーガジェット(アルベド、 normals、depth、roughness、シェーディング、metallic)を作るPipeline(パイプライン)を提案し、それに対してピラー・バーンのようなニューラルネットワークを通して最...

Original: arXiv:2503.15147v2 Announce Type: replace Abstract: Despite recent advances in text-to-image generation, controlling geometric layout and PBR material properties in synthesized scenes remains challen...

arxiv_cs_gr 2026/2/10

粒子々に対してより多くの力:部分最優IMALトランスポートに基づく流体シミュレーションの解析幾何学

More Power to the Particles: Analytic Geometry for Partial Optimal Transport-based Fluid simulation

我々は、全体的な最適トランスポートに基づく自由表面流動シミュレーションに対する汎用データ構造とアルゴリズムを提案しました。これは「Power Particles」メソッドやGallouët-Mérigotのスキームなどの一部の最適トランスポートに基づく方法に適用可能です。以前の手法は、ベーシックな古典的凸セルクッキング・アルゴリズムを使用し、セルをディシジョン化してました。これにより計算コストが高...

Original: arXiv:2601.05765v2 Announce Type: replace Abstract: We propose unified data structures and algorithms for free-surface fluid simulations based on partial optimal transport, such as the Power Particle...

arxiv_cs_cv 2026/2/10

法医学的履物解析のためのスケーラブルな spatial point process models

Scalable spatial point process models for forensic footwear analysis

arXiv:2602.07006v1 発表タイプ: new 要旨: 犯罪現場から回収された靴跡証拠は、法科学捜査において重要な役割を果たします。靴跡を調べることで、捜査官は被疑者が履いていた靴の詳細を特定できます。しかし、被疑者の靴が現場の跡とメーカーやモデルが一致することを示すだけでは不十分な場合があります。通常、同じサイズ・メーカー・モデルの靴は何千足と生産されており、そのいずれもが跡を残し...

Original: arXiv:2602.07006v1 Announce Type: new Abstract: Shoe print evidence recovered from crime scenes plays a key role in forensic investigations. By examining shoe prints, investigators can determine deta...

arxiv_cs_cv 2026/2/10

学習してはいけない箇所:信頼できる意思決定のための Prior-Aligned Training と Subset-based Attribution Constraints

Where Not to Learn: Prior-Aligned Training with Subset-based Attribution Constraints for Reliable Decision-Making

arXiv:2602.07008v1 アナウンス種別: new 要旨: 信頼できるモデルは単に正しく予測するだけでなく、受け入れ可能な証拠によって決定を正当化できるべきである。しかし従来の監督学習は通常クラスレベルのラベルしか提供しないため、モデルは意図された証拠ではなくショートカット相関を利用して高い精度を達成してしまうことがある。人間のprior(事前知識)はこのような挙動を制約するのに役立...

Original: arXiv:2602.07008v1 Announce Type: new Abstract: Reliable models should not only predict correctly, but also justify decisions with acceptable evidence. Yet conventional supervised learning typically ...

arxiv_cs_cv 2026/2/10

MAU-GPT: Anomaly-aware and Generalist Experts Adaptation によるマルチタイプ産業異常理解の強化

MAU-GPT: Enhancing Multi-type Industrial Anomaly Understanding via Anomaly-aware and Generalist Experts Adaptation

arXiv:2602.07011v1 公開タイプ: new 概要: 産業製造が拡大するにつれて、品質管理のための細粒度な製品画像解析の自動化が重要になっている。しかし、既存のアプローチはデータセットのカバレッジ不足と、多様で複雑な異常パターンに対するモデルの一般化性能の低さによって制約されている。これらの課題に対処するため、本研究では Multi-type industrial Anomaly U...

Original: arXiv:2602.07011v1 Announce Type: new Abstract: As industrial manufacturing scales, automating fine-grained product image analysis has become critical for quality control. However, existing approache...

arxiv_cs_cv 2026/2/10

網膜セグメンテーションと定量化のための汎用モデル

A General Model for Retinal Segmentation and Quantification

arXiv:2602.07012v1 公開タイプ: new 要旨: 網膜イメージングは高速で非侵襲的、かつ広く利用可能であり、眼科および全身の健康評価に対して定量化可能な構造的および血管学的シグナルを提供する。このアクセスの容易さは、定量的な網膜フェノタイプが眼疾患や全身疾患とどのように関連するかを研究する機会を生む。しかし、公的なマルチラベルデータセットの限られた利用可能性や、セグメンテーション...

Original: arXiv:2602.07012v1 Announce Type: new Abstract: Retinal imaging is fast, non-invasive, and widely available, offering quantifiable structural and vascular signals for ophthalmic and systemic health a...

arxiv_cs_cv 2026/2/10

「ノー」を言わせるステアリング:Vision Language Modelsにおけるactivation steeringによるConfigurable Refusal

Steering to Say No: Configurable Refusal via Activation Steering in Vision Language Models

arXiv:2602.07013v1 アナウンス種別: new 概要: Vision Language Models (VLMs) の急速な進展に伴い、refusal mechanismsは責任ある安全なモデル挙動を確保するための重要な要素となっている。しかし、既存のrefusal strategiesは概して one-size-fits-all であり、多様なユーザーのニーズや文脈上の制約に適...

Original: arXiv:2602.07013v1 Announce Type: new Abstract: With the rapid advancement of Vision Language Models (VLMs), refusal mechanisms have become a critical component for ensuring responsible and safe mode...