12673 articles

arxiv_cs_cv 2026/2/10

組織病理学全スライド画像における効果的かつ効率的なコンテキスト認識な核細胞検出への取り組み

Towards Effective and Efficient Context-aware Nucleus Detection in Histopathology Whole Slide Images

arXiv:2503.05678v2 Announce Type: replace-cross Abstract: 組織病理学全スライド画像(WSI)における核細胞検出は、多岐にわたる臨床応用において不可欠です。WSI のギガピクセルサイズは、核細胞検出にスライディングウィンドウ手法の使用を要請します。しかし、主流の方法は各スライディングウィンドウを独立して処理しており、広範な文脈情報を無視し、容...

Original: arXiv:2503.05678v2 Announce Type: replace-cross Abstract: Nucleus detection in histopathology whole slide images (WSIs) is crucial for a broad spectrum of clinical applications. The gigapixel size of...

arxiv_cs_cv 2026/2/10

エンドツーエンド自律走行における衝突リスク推定:損傷予測に基づく手法

Collision Risk Estimation via Loss Prediction in End-to-End Autonomous Driving

arXiv:2503.07425v2 Announce Type: replace-cross 本文書において提示されるのは、衝突リスクの推定と回避が自律走行(AD)システムの安全性において中心的な役割を果たしているという事実は、最近登場したエンドツーエンド型の AD システムが、計画軌道が他の物体に過近になることを罰するために損失を最小化することで衝突回避能力を獲得したという点です。試験段階に...

Original: arXiv:2503.07425v2 Announce Type: replace-cross Abstract: Collision risk estimation and avoidance play central roles in the safety of autonomous driving (AD) systems. Recently emerged end-to-end AD s...

arxiv_cs_cv 2026/2/10

CT スキャンにおける脳内出血分類のための Vision Transformer: 適応的なスキャンレベルの意思決定融合を実現するエントロピー認識度の模糊積分戦略を用いた

Vision Transformer for Intracranial Hemorrhage Classification in CT Scans Using an Entropy-Aware Fuzzy Integral Strategy for Adaptive Scan-Level Decision Fusion

arXiv:2503.08609v2 Announce Type: replace-cross Abstract: 脳内出血(ICH)は、頭蓋骨内への内部出血を引き起こす脳血管の破裂による、極めて重要な医療緊急事態です。出血サブタイプの正確かつタイムリーな分類は、効果的な臨床意思決定に不可欠です。この課題に対処するため、我々は階層的時間注意機構を有する пирамидальный Vision ...

Original: arXiv:2503.08609v2 Announce Type: replace-cross Abstract: Intracranial hemorrhage (ICH) is a critical medical emergency caused by the rupture of cerebral blood vessels, leading to internal bleeding w...

arxiv_cs_cv 2026/2/10

Sparse Ellipsoidal Radial Basis Function Networks による符号距離場の近似:動的なマルチ目標最適化戦略

Approximating Signed Distance Fields With Sparse Ellipsoidal Radial Basis Function Networks: A Dynamic Multi-Objective Optimization Strategy

arXiv:2505.02350v4 Announce Type: replace-cross 本稿では、暗黙曲面の符号距離関数(SDF)の正確でコンパクトな表現について考察します。SDF 値は、ポイントクラウド、三角形メッシュ、解析式、事前学習されたニューラルネットワークなどの多様なソースから得られます。与えられた空間格子点における SDF 値を用いて、暗黙曲面の幾何学的形状を維持しつつ可能な限...

Original: arXiv:2505.02350v4 Announce Type: replace-cross Abstract: Accurate and compact representation of signed distance functions (SDFs) of implicit surfaces is crucial for efficient storage, computation, a...

arxiv_cs_cv 2026/2/10

FlashKAT:コルモゴロフ・アノルドトランスフォーマーにおける性能ボトルネックの解明と対応

FlashKAT: Understanding and Addressing Performance Bottlenecks in the Kolmogorov-Arnold Transformer

arXiv:2505.13813v3 Announce Type: replace-cross Abstract: コルモゴロフ・アノルドネットワーク (KAN) は、多重層パーセプトロン (MLP) の代替手段として、その高い表現力と解釈可能性により人気が高まっている。しかし、KAN はトレーニング安定性の欠如と計算コストによる桁違いの遅延に悩まされ、大規模タスクへの適用が制限されている。最近、...

Original: arXiv:2505.13813v3 Announce Type: replace-cross Abstract: The Kolmogorov-Arnold Network (KAN) has been gaining popularity as an alternative to the multilayer perceptron (MLP) due to its greater expre...

arxiv_cs_cv 2026/2/10

Diffusion Distillation における一般化の理解:確率流距離に基づくアプローチ

Understanding Generalization in Diffusion Distillation via Probability Flow Distance

arXiv:2505.20123v2 Announce Type: replace-cross Abstract:ディフューョンディジタルテーションは、効率的な生成を持つ軽量かつ少ステップのディフューョンモデルを学習するための効果的なアプローチを提供しています。しかし、その一般化性能の評価は依然として課題が多く、理論的な指標は高次元データに対して実用的ではない一方で、一般化を厳密に測定する実用的...

Original: arXiv:2505.20123v2 Announce Type: replace-cross Abstract: Diffusion distillation provides an effective approach for learning lightweight and few-steps diffusion models with efficient generation. Howe...

arxiv_cs_cv 2026/2/10

Neural-Augmented Kelvinlet for Real-Time Soft Tissue Deformation Modeling

arXiv:2506.08043v3 Announce Type: replace-cross Abstract: 軟組織相互作用の高精度かつ効率的なモデリングは、手術シミュレーション、手術ロボティクス、およびモデルベースの手術自動化の進展にとって不可欠である。リアルタイムレイテンシを達成するために、古典的な有限要素法(FEM)解算者はしばしばニューラル近似に置き換えられるが、物理的事前知識を組み...

Original: arXiv:2506.08043v3 Announce Type: replace-cross Abstract: Accurate and efficient modeling of soft-tissue interactions is fundamental for advancing surgical simulation, surgical robotics, and model-ba...

arxiv_cs_cv 2026/2/10

タスク条件付きプロbing が、指示調整されたマルチモーダル LLM における脳同期パターンの開示

Task-Conditioned Probing Reveals Brain-Alignment Patterns in Instruction-Tuned Multimodal LLMs

arXiv:2506.08277v2 Announce Type: replace-cross 要旨:最近の体素別マルチモーダル脳エンコーディング研究により、マルチモーダル大規模言語モデル(MLLM)は、単一モードモデルと比較してより高い脳同期性を示していることが示されています。さらに、指示調整されたマルチモーダル(IT)モデルは、特定のタスク向けの表現を生成し、それが脳活動と強く一致することが...

Original: arXiv:2506.08277v2 Announce Type: replace-cross Abstract: Recent voxel-wise multimodal brain encoding studies have shown that multimodal large language models (MLLMs) exhibit a higher degree of brain...

arxiv_cs_cv 2026/2/10

SIMSHIFT: 分布シフトへの神経サロゲート適応のためのベンチマーク

SIMSHIFT: A Benchmark for Adapting Neural Surrogates to Distribution Shifts

arXiv:2506.12007v2 Announce Type: replace-cross 摘要: 偏微分方程式(PDE)のための神経サロゲートは、そのトレーニング分布以外の問題構成(例:新しい初期条件や構造的次元)で評価される際、著しい性能低下を示す傾向があります。無教師学習ドメイン適応(UDA)技術は、画像認識や自然言語処理の分野でラベル付けされていないデータなしでのドメイン間汎化のために...

Original: arXiv:2506.12007v2 Announce Type: replace-cross Abstract: Neural surrogates for Partial Differential Equations (PDEs) often suffer significant performance degradation when evaluated on problem config...

arxiv_cs_cv 2026/2/10

Sequential Attention-based Sampling for Histopathological Analysis

arXiv:2507.05077v4 Announce Type: replace-cross Abstract: 深層学習は、自動化された組織診断においてますます活用されています。しかし、全スライド画像(WSI)はしばしば数十億画素に及び、これらを一括して高解像度で解析することは計算的に不可能に近いものです。診断用のラベルは主にスライドレベルのみで利用可能であり、画像を微視的な(パッチレベル)...

Original: arXiv:2507.05077v4 Announce Type: replace-cross Abstract: Deep neural networks are increasingly applied in automated histopathology. Yet, whole-slide images (WSIs) are often acquired at gigapixel siz...

arxiv_cs_cv 2026/2/10

コロニアルバージニアの地権付与をジオロケーションするための大規模言語モデルのベンチマーク化

Benchmarking Large Language Models for Geolocating Colonial Virginia Land Grants

arXiv:2508.08266v2 Announce Type: replace-cross Abstract: ヴェرجニア州の17世紀および18世紀の土地特許は、主に文法的な境界記述としてのみ残り、空間解析を制限しています。本研究は、これらの説明的記述を、特定の評価文脈内で地理的に正確な緯度/経度座標に変換する際の、現在の世代の大規模言語モデル(LLM)を系統的に評価しています。5,471件...

Original: arXiv:2508.08266v2 Announce Type: replace-cross Abstract: Virginia's seventeenth- and eighteenth-century land patents survive primarily as narrative metes-and-bounds descriptions, limiting spatial an...

arxiv_cs_cv 2026/2/10

非対比 CT MRI から脳腫瘍の強化を予測する人工知能

Predicting brain tumour enhancement from non-contrast MR imaging with artificial intelligence

arXiv:2508.16650v2 Announce Type: replace-cross 要約: 脳腫瘍画像評価には通常、対比前と対比後 MR 成像が不可欠ですが、頻回な追跡観察、腎不全、アレルギー、および小児患者においては、ガドリニウム投与は必ずしも望ましくありません。我々は、非対比 MR 成像序列のみを用いて脳腫瘍の強化を予測できるディープラーニングモデルを開発し、検証することを目的と...

Original: arXiv:2508.16650v2 Announce Type: replace-cross Abstract: Brain tumour imaging assessment typically requires both pre- and post-contrast MRI, but gadolinium administration is not always desirable, su...

arxiv_cs_cv 2026/2/10

A-FloPS: 適応型フローパスサンプリヤーによる拡散モデルの加速

A-FloPS: Accelerating Diffusion Models via Adaptive Flow Path Sampler

arXiv:2509.00036v2 発表タイプ:置き換えクロス サマリエ:拡散モデルは多様なモダリティにおいて最先端の生成性能を提供していますが、内在する反復サンプリングプロセスにより計算コストが高くなります。既存のトレーニング不要な加速手法は、逆時間 ODE(微分方程式)のための数値解算器を改良することで効果を高めるものですが、それらの効果は根本的に下流のサンプリング経路の非効率性に制限されて...

Original: arXiv:2509.00036v2 Announce Type: replace-cross Abstract: Diffusion models deliver state-of-the-art generative performance across diverse modalities but remain computationally expensive due to their ...

arxiv_cs_cv 2026/2/10

ManiVID-3D: 分岐された 3D 表現を通じた観視点不変性の強化学習によるロボティクス操作の一般化

ManiVID-3D: Generalizable View-Invariant Reinforcement Learning for Robotic Manipulation via Disentangled 3D Representations

arXiv:2509.11125v2 Announce Type: replace-cross Abstract: 実世界の操作タスクに視覚的強化学習 (RL) ポリシーを展開する際、カメラからの観視点の变化はしばしば妨げとなります。一定の前方カメラで訓練されたポリシーが、カメラがシフトされた場合に失敗することは避けられない実際の環境において、センサーの配置を適切に管理することは困難です。既存の方...

Original: arXiv:2509.11125v2 Announce Type: replace-cross Abstract: Deploying visual reinforcement learning (RL) policies in real-world manipulation is often hindered by camera viewpoint changes. A policy trai...

arxiv_cs_cv 2026/2/10

MetaCluster:Kolmogorov-Arnold ネットワークの深層圧縮を可能にする

MetaCluster: Enabling Deep Compression of Kolmogorov-Arnold Network

arXiv:2510.19105v2 Announce Type: replace-cross 要約:Kolmogorov-Arnold ネットワーク(KAN)はスカラー重みを用いる代わりに、エッジごとの基底係数ベクターを用いることで、表現力と精度を向上させますが、パラメータ数とメモリ使用量を乗算的に増大させる問題があります。本研究では、KAN の精度を犠牲化さずに KAN を高度に圧縮可能にする...

Original: arXiv:2510.19105v2 Announce Type: replace-cross Abstract: Kolmogorov-Arnold Networks (KANs) replace scalar weights with per-edge vectors of basis coefficients, thereby increasing expressivity and acc...

arxiv_cs_cv 2026/2/10

BEAT: VLM ベースのエンボディドエージェントに対する対比によるトリガー学習を利用したビジュアルバックドア攻撃

BEAT: Visual Backdoor Attacks on VLM-based Embodied Agents via Contrastive Trigger Learning

arXiv:2510.27623v2 Announce Type: replace-cross 摘要:最近のビジョン・ langage モデル(VLM)の進歩は、エンボディドエージェントの直接認識、推論、タスク指向アクション計画機能を可能にし、その推進力を加速させた。しかし、このビジュアル駆動型のエンボディドエージェントは新たな攻撃表面を開放しており、そこではエージェントが通常通り動作した後、シー...

Original: arXiv:2510.27623v2 Announce Type: replace-cross Abstract: Recent advances in Vision-Language Models (VLMs) have propelled embodied agents by enabling direct perception, reasoning, and planning task-o...

arxiv_cs_cv 2026/2/10

ディフュージョンモデルにおける効率的なテストタイムの反復誤り補正

Test-Time Iterative Error Correction for Efficient Diffusion Models

arXiv:2511.06250v3 Announce Type: replace-cross 要約: 資源制約されたデバイス向けの高品質画像生成への需要が高まる中、効率的なディフュージョンモデルの関心が高まっています。しかし、この類のモデルは効率的化技術によって導入された近似的な誤差に悩まれ、それが生成の品質を著しく低下させます。一旦デプロイされると、これらの誤りを修正することは困難であり、通常...

Original: arXiv:2511.06250v3 Announce Type: replace-cross Abstract: With the growing demand for high-quality image generation on resource-constrained devices, efficient diffusion models have received increasin...

arxiv_cs_cv 2026/2/10

CostNav: 現実世界の物理 AIエージェントの経済コスト評価のためのナビゲーションベンチマーク

CostNav: A Navigation Benchmark for Real-World Economic-Cost Evaluation of Physical AI Agents

arXiv:2511.20216v3 Announce Type: replace-cross 摘要: 現在のナビゲーションベンチマークは、単純化された環境におけるタスク成功に重点を置いているため、自律送達システムの現実世界の商業化において本質的な多面的な経済制約を無視している。我々は、業界標準データ(例:SEC 開示書類や AIS 傷害報告書)と、Isaac Sim の詳細な衝突および貨物ダイナ...

Original: arXiv:2511.20216v3 Announce Type: replace-cross Abstract: While current navigation benchmarks prioritize task success in simplified settings, they neglect the multidimensional economic constraints es...

arxiv_cs_cv 2026/2/10

背景分布シフト下におけるオープンセットドメイン適応:課題と証明に基づく効率的解決策

Open-Set Domain Adaptation Under Background Distribution Shift: Challenges and A Provably Efficient Solution

arXiv:2512.01152v3 Announce Type: replace-cross 摘要:機械学習システムを現実世界に展開する際、核心となる課題は、データがシフトしてもパフォーマンスを維持するモデルを維持することです。このようなシフトには様々な形式があり、トレーニング時には存在しなかった新しいクラスが出現する問題はオープンセット認識と呼ばれます。また、既知カテゴリーの分布が変化すること...

Original: arXiv:2512.01152v3 Announce Type: replace-cross Abstract: As we deploy machine learning systems in the real world, a core challenge is to maintain a model that is performant even as the data shifts. ...

arxiv_cs_cv 2026/2/10

同時触覚・視覚感知を用いたマルチモーダルロボーマニピュレーション学習

Simultaneous Tactile-Visual Perception for Learning Multimodal Robot Manipulation

arXiv:2512.09851v2 Announce Type: replace-cross Abstract: ロボットマニピュレーションでは、複雑な現実世界タスクを処理するために豊富なマルチモーダル感知と効果的な学習フレームワークの両方が必要です。触覚と視覚感知を統合した透過皮膚(ST: See-Through-Skin)センサーは有望な感知能力を提供しており、現代の真似学習は政策取得のため...

Original: arXiv:2512.09851v2 Announce Type: replace-cross Abstract: Robotic manipulation requires both rich multimodal perception and effective learning frameworks to handle complex real-world tasks. See-throu...