3496 articles
AI 気象モデルにおけるメカニズム的可読性を高めるツール
Mechanistic Interpretability Tool for AI Weather Models
arXiv:2604.20467v1 発表タイプ:クロス 要約: 人工知能(AI)気象モデルは急速に向上しており、すでに確立された伝統的な数値気象予報(NWP)との予測精度が競合的です。この新しい手法への信頼を高めるには、予測がどのように生成されているかを理解することが不可欠です。これは、これらの AI 気象モデルがほぼ黒箱として残っているという巨大な課題です。機械学習(ML)の他の分野では、メ...
Original: arXiv:2604.20467v1 Announce Type: cross Abstract: Artificial Intelligence (AI) weather models are improving rapidly, and their forecasts are already competitive with long-established traditional Nume...
VTouch++:視覚ベースの触覚強化を用いた双腕操作のためのマルチモーダルデータセット
VTouch++: A Multimodal Dataset with Vision-Based Tactile Enhancement for Bimanual Manipulation
arXiv:2604.20444v1 Announce Type: cross Abstract: エンボディードな知能は近年急速に進歩したが、特に接触が豊富なタスクにおける双腕操作は依然として挑戦的です。この課題の主な原因は、物理相互作用信号、体系的なタスク組織、そして十分な規模を持つデータセットの不足にあります。これらの限界に対処するために、VTOUCH データセットを導入します。このデータ...
Original: arXiv:2604.20444v1 Announce Type: cross Abstract: Embodied intelligence has advanced rapidly in recent years; however, bimanual manipulation-especially in contact-rich tasks remains challenging. This...
DialToM: 心理理論を備えた状態駆動型対話軌跡の予測のためのベンチマーク
DialToM: A Theory of Mind Benchmark for Forecasting State-Driven Dialogue Trajectories
arXiv:2604.20443v1 発表 タイプ:クロス 摘要: 大規模言語モデル(LLM)には心理理論(ToM)能力が備わっていると示されています。ただし、これが堅牢な推論から生じるものであるのか、偽の相関から生じるものであるのかはまだ明らかではありません。本稿では、多数選択フレームワークを使用して自然な人間対話から構築した、人間による検証を受けた DialToM ベンチマークを導入します。...
Original: arXiv:2604.20443v1 Announce Type: cross Abstract: Large Language Models (LLMs) have been shown to possess Theory of Mind (ToM) abilities. However, it remains unclear whether this stems from robust re...
WebGen-R1: レインフォースメント・ラーニングを用いて、機能的かつ美学的な Web サイトを生成し続ける大規模言語モデルへのインセンティブ化
WebGen-R1: Incentivizing Large Language Models to Generate Functional and Aesthetic Websites with Reinforcement Learning
arXiv:2604.20398v1 Announce Type: cross アブストラクト: 大規模言語モデル(LLM)は機能的なコードの生成には優れているものの、機能的かつ視覚的に美しいマルチページ Web サイトを生成といったプロジェクトレベルのタスクは依然として非常に困難です。既存の手法は単一ページの静的 Web サイトに限定されることが多く、エージェント・フレームワークは一般的にプロ...
Original: arXiv:2604.20398v1 Announce Type: cross Abstract: While Large Language Models (LLMs) excel at function-level code generation, project-level tasks such as generating functional and visually aesthetic ...
不安定な流れの AI モデルにおける幻覚現象の報告
AI models of unstable flow exhibit hallucination
arXiv:2604.20372v1 Announce Type: cross 摘要:流体力学における不安定な輸送(粘性指状分裂と呼ばれる定型的な問題)の例えを用いて、AI モデルにおける幻覚の最初の系統的証拠を報告します。AI ベースの不安定な流れのモデル化は、急速に進化し多尺度な指状分裂パターンを正確に解析するのが困難であるため、依然として課題としています。私たちは、視覚的には現実的だが物理的...
Original: arXiv:2604.20372v1 Announce Type: cross Abstract: We report the first systematic evidence of hallucination in AI models of fluid dynamics, demonstrated in the canonical problem of hydrodynamically un...
Black-box 大規模言語モデルの医療予測解釈のための代理モデリング
Surrogate modeling for interpreting black-box LLMs in medical predictions
arXiv:2604.20331v2 Announce Type: cross 要約:巨大なデータセットで訓練された大規模言語モデル(LLMs)は、パラメータ内に広範な実世界の知識をコード化していますが、そのブラックボックス的な性質により、このコード化のメカニズムと範囲は不明瞭です。複雑な系统进行する代理モデリング(簡素化されたモデルを使用して複雑な系统进行を近似する手法)は、ブラックボックスモ...
Original: arXiv:2604.20331v2 Announce Type: cross Abstract: Large language models (LLMs), trained on vast datasets, encode extensive real-world knowledge within their parameters, yet their black-box nature obs...
幾何的降温(Geometric Tempering)の性質と勾配フローダイナミクスにおける限界
Properties and limitations of geometric tempering for gradient flow dynamics
arXiv:2604.20301v1 Announce Type: cross 要約:$\\pi$ による確率分布からのサンプリング問題を考察します。これは既知の通り、確率分布の空間上の最適化問題として記述でき、目標は $\\pi$ からの Kullback-Leibler 差(KL 散度)を最小化することです。 我々は、幾何的降温(geometric tempering)を定義した移動ターゲ...
Original: arXiv:2604.20301v1 Announce Type: cross Abstract: We consider the problem of sampling from a probability distribution $\pi$. It is well known that this can be written as an optimisation problem over ...
オンライン生存解析:Cox 比例危険度モデルにおけるバンディ手法
Online Survival Analysis: A Bandit Approach under Cox PH Model
生存解析は、欠測を含む時系列イベントデータのマッピングをモデル化するために広く使用される統計的な枠組みである。古典的手法である Cox 比例危険度(Cox PH)モデルは、共変量が危険関数に及ぼす効果を推定するための半パラメトリックアプローチを提供する。その重要性にもかかわらず、生存解析はオンライン環境ではほとんど研究されておらず、特にバンディ枠組みにおいて、新たなデータが時間とともに到着する際に...
Original: arXiv:2604.20296v1 Announce Type: cross Abstract: Survival analysis is a widely used statistical framework for modeling time-to-event data under censoring. Classical methods, such as the Cox proporti...
AROMA: 多模態アーキテクチャに対する拡張推論を用いた仮想細胞遺伝的乱乱モデル化
AROMA: Augmented Reasoning Over a Multimodal Architecture for Virtual Cell Genetic Perturbation Modeling
arXiv:2604.20263v1 Announce Type: cross Abstract: 仮想細胞モデル化は、遺伝的乱打条件下での分子状態の変化をシミュレーションによって予測するもので、生物学のメカニズム研究において不可欠です。しかし、既存のアプローチは制約のない推論、解釈不能な予測、そしてレギュレーションのトポロジと整合性の低い検索シグナルという課題に悩んでいます。これらの制限を克服す...
Original: arXiv:2604.20263v1 Announce Type: cross Abstract: Virtual cell modeling predicts molecular state changes under genetic perturbations in silico, which is essential for biological mechanism studies. Ho...
RADS: 強化学習によるサンプル選択が、低リソースかつ不平衡な臨床設定における転移学習を改善する
RADS: Reinforcement Learning-Based Sample Selection Improves Transfer Learning in Low-resource and Imbalanced Clinical Settings
arXiv:2604.20256v1 Announce Type: cross 要約:転移学習における一般的な戦略は数ショットファインチューニングですが、その成功はトレーニング例として選択されるサンプルの品質に大きく依存します。不確実性サンプリングや多様性サンプリングなどのアクティブ学習手法は有用なサンプルを抽出できますが、極めて低リソースかつクラス不平衡な条件下では、真に情報豊富なサンプルより...
Original: arXiv:2604.20256v1 Announce Type: cross Abstract: A common strategy in transfer learning is few shot fine-tuning, but its success is highly dependent on the quality of samples selected as training ex...
Mol-Debate: 分子設計における構造的推論の改善を多エージェントディスカッションがもたらす
Mol-Debate: Multi-Agent Debate Improves Structural Reasoning in Molecular Design
arXiv:2604.20254v1 発表 タイプ: cross サマリー: テキスト指向な分子設計は、AI による創薬において極めて重要な能力ですが、厳密な化学制約下で、非線形な分子構造を連続的な自然言語指示に一致させ mappings を行うことは依然として挑戦的です。既存の多くのアプローチ(RAG、CoT プロンプティング、またはファインチューニング・強化学習など)は、ほとんどワンショットの...
Original: arXiv:2604.20254v1 Announce Type: cross Abstract: Text-guided molecular design is a key capability for AI-driven drug discovery, yet it remains challenging to map sequential natural-language instruct...
振触覚好意度学習:個人向けの振動フィードバックのための不確実性認識に基づく好意度学習
Vibrotactile Preference Learning: Uncertainty-Aware Preference Learning for Personalized Vibration Feedback
arXiv:2604.20210v2 告知タイプ: クロス 要旨:振触覚知覚における個人差は、インタラクティブシステムにおけるハプティックフィードバックの増加に伴い、パーソナライゼーションの重要性が高まっていることを示唆している。我々は、高斯過程ベースの不確実性認識に基づく好意度学習を用いて、ユーザー固有の振触覚パラメータの好意度空間を捉えるシステムである「振触覚好意度学習 (VPL)」を提案した...
Original: arXiv:2604.20210v2 Announce Type: cross Abstract: Individual differences in vibrotactile perception underscore the growing importance of personalization as haptic feedback becomes more prevalent in i...
WildFireVQA: 機上で火災モニタリングのための大規模分光放射赤外 VQA ベンチマーク
WildFireVQA: A Large-Scale Radiometric Thermal VQA Benchmark for Aerial Wildfire Monitoring
arXiv:2604.20190v1 告知タイプ: cross 摘要: 火災モニタリングでは、航空プラットフォームからのタイムリーで実行可能な状況認識が必要ですが、既存の空中視覚質問応答(VQA)ベンチマークは、分光放射データに基づく熱的測定に根ざした火災固有のマルチモーダル推論を評価していません。我々は、RGB 画像と分光放射熱データを活用した機上火災モニタリング用大規模 VQA ベンチマークで...
Original: arXiv:2604.20190v1 Announce Type: cross Abstract: Wildfire monitoring requires timely, actionable situational awareness from airborne platforms, yet existing aerial visual question answering (VQA) be...
Markov モード化された散斑相関を用いたマルチビューデジタルホログラフィーの最大尤回帰
Maximum Likelihood Reconstruction for Multi-Look Digital Holography with Markov-Modeled Speckle Correlation
arXiv:2604.20154v1 発表タイプ:クロス 摘要:マルチビュー取得は、デジタルホログラフィーなどの非干渉計測系における散斑ノイズを低減するために広く用いられる戦略である。複数の測取得を行うことで、散斑は平均化または連成回帰を通じて抑制され、一般的には散斑の現実化がそれぞれのビュー間において統計的に独立であると仮定されている。しかし、実際にはハードウェアの制約により測定の多様性が制限さ...
Original: arXiv:2604.20154v1 Announce Type: cross Abstract: Multi-look acquisition is a widely used strategy for reducing speckle noise in coherent imaging systems such as digital holography. By acquiring mult...
世界モデルを用いた安全な自律型ロボット内血管介入への道
Toward Safe Autonomous Robotic Endovascular Interventions using World Models
arXiv:2604.20151v1 Announce Type: cross 摘要:自律型機械的溶栓術(MT)は、血管の幾何学的形状が高度に変異する点や、正確なリアルタイム制御の必要性などにより、大きな課題を持っています。強化学習(RL)は内血管導航の自動化有望なパラダイムとして登場しましたが、既存のアプローチは、多様な患者の解剖学構造や長距離導航において、十分な頑健性を示していません。本研究で...
Original: arXiv:2604.20151v1 Announce Type: cross Abstract: Autonomous mechanical thrombectomy (MT) presents substantial challenges due to highly variable vascular geometries and the requirements for accurate,...
Meta-Tool: 小型言語モデル向けの効率的な少ショットツール適応
Meta-Tool: Efficient Few-Shot Tool Adaptation for Small Language Models
arXiv:2604.20148v1 Announce Type: cross 摘要:小型言語モデルは、複雑な適応機構なしに強力なツール使用性能を達成できるか?本論文は、Meta-Tool という制御された実証研究を通じて、この疑問を探求します。Meta-Tool は、ハイパーネットワークに基づく LoRA 適応と、慎重に設計された少ショットプロンプティングを比較する研究です。Llama-3.2-...
Original: arXiv:2604.20148v1 Announce Type: cross Abstract: Can small language models achieve strong tool-use performance without complex adaptation mechanisms? This paper investigates this question through Me...
不確実性のある分布外強健性のある確率最適化
Robust Out-of-Distribution Stochastic Optimization
arXiv:2604.20147v1 Announce Type: cross 摘要:不確実性のあるデータ驱动的意思決定プロセスでは、通常、未知のターゲット確率分布からの過去のデータ収集が前提とされます。しかし、意思決定を行う前に、ターゲット分布からのデータの何らのアクセスも持たない場合もあるかもしれません。この課題に対処するため、本稿では、見られない分布下における強健な意思決定のために関連するデ...
Original: arXiv:2604.20147v1 Announce Type: cross Abstract: Data-driven decision-making under uncertainty typically presumes the collection of historical data from an unknown target probability distribution. H...
クラウドデータウェアハウスにおける実行前のスロット時間予測:機能範囲に限定された機械学習アプローチ arXiv:2604.20145v1 発表タイプ: クロス
Pre-Execution Query Slot-Time Prediction in Cloud Data Warehouses: A Feature-Scoped Machine Learning Approach
Cloud data warehouses(クラウドデータウェアハウス)は、使用したスロット時間に基づいて計算リソースを課金します。共有マルチテナント環境において、クエリのコストは高度に変動しており、実行前に正確に見積もりが困難なため、予算超過やスケジューリングの性能低下を引き起こしています。静的なクエリプランナーの直感手法は、複雑な SQL 構文、データのスケーリング、および工作負荷の競合を捉え...
Original: arXiv:2604.20145v1 Announce Type: cross Abstract: Cloud data warehouses bill compute based on slot-time consumed. In shared multi-tenant environments, query cost is highly variable and hard to estima...
放射輸送方程式に対する機械学習によるモーメント閉じ込めモデル IV: 二次元における対称化可能な双曲性を強制すること
Machine learning moment closure models for the radiative transfer equation IV: enforcing symmetrizable hyperbolicity in two dimensions
arXiv:2604.20143v1 Announce Type: cross 要旨:本研究は、放射輸送方程式(RTE)に対する機械学習(ML)モーメント閉じ込めモデルに関するシリーズの第 4 報告書である。最初の 3 つの論文では、我々は 1 次元物理空間と 1 次元角度空間(1D1V)のスラブ幾何形において RTE を検討し、グラデントベースの ML モーメント閉じ込め [1] を導入した。そ...
Original: arXiv:2604.20143v1 Announce Type: cross Abstract: This is our fourth work in the series on machine learning (ML) moment closure models for the radiative transfer equation (RTE). In the first three pa...
HiPO: LLM における適応的推理のための階層型好ましさ最適化
HiPO: Hierarchical Preference Optimization for Adaptive Reasoning in LLMs
arXiv:2604.20140v1 発表タイプ:cross 摘要: 直接好ましさ最適化 (Direct Preference Optimization, DPO) は、大規模言語モデルを人間の好ましさに合わせて整えるための効果的なフレームワークですが、複雑な推理タスクでは限界があります。DPO は好ましい応答と不向きな応答全体の生成確率を最適化するため、推理タスクに特有の多数のステップにわたる解...
Original: arXiv:2604.20140v1 Announce Type: cross Abstract: Direct Preference Optimization (DPO) is an effective framework for aligning large language models with human preferences, but it struggles with compl...