3496 articles

arxiv_cs_lg 2026/4/24

目標ネットワークを使用しない分布値推定に基づく頑健な品質多様性最適化

Distributional Value Estimation Without Target Networks for Robust Quality-Diversity

arXiv:2604.20381v1 発表タイプ:新 要約:品質多様性(QD)アルゴリズムは多様な技能のレパートリーを発見することに優れていますが、サンプル効率が悪く、複雑な移動タスクを解決するには通常数千万環境ステップが必要とされます。近年の強化学習(RL)の進歩により、高アップデート・データ比率(UTD)がアクター・クリティック学習を加速することが示されました。しかし、標準的な高 UTD ア...

Original: arXiv:2604.20381v1 Announce Type: new Abstract: Quality-Diversity (QD) algorithms excel at discovering diverse repertoires of skills, but are hindered by poor sample efficiency and often require tens...

arxiv_cs_lg 2026/4/24

DeFi のイベント認識型予測への道:チェーン上で動作する自動価格形成プロトコルから得られる洞察

Towards Event-Aware Forecasting in DeFi: Insights from On-chain Automated Market Maker Protocols

arXiv:2604.20374v1 Announce Type: new 要旨: 分散型金融(DeFi)の中核インフラである自動価格形成(AMM)は、決定論的な保有率比率機構を通じてチェーン上の資産価格をユニークにドライブします。従来の市場とは異なり、AMM の価格ダイナミクスはオフチェーン情報の連続的対応ではなく、チェーン上のイベント(例:スワップ)によって保有率比率が変化し引き起こされます...

Original: arXiv:2604.20374v1 Announce Type: new Abstract: Automated Market Makers (AMMs), as a core infrastructure of decentralized finance (DeFi), uniquely drive on-chain asset pricing through a deterministic...

arxiv_cs_lg 2026/4/24

コンディショナル拡散モデルによる新規製品ライフサイクルの冷開始予報

Cold-Start Forecasting of New Product Life-Cycles via Conditional Diffusion Models

arXiv:2604.20370v1 Announce Type: new 要旨:新発売製品のライフサイクル軌道の予報は、発売計画、リソース配分、および早期リスク評価において重要である。このタスクは、製品固有の結果履歴が限られたり入手不可能である、あるいは存在しない前発売および発売直後のフェーズにおいて特に困難であり、これを冷開始問題と呼ぶ。これらのフェーズでは、需要パターンが信頼性あるように観測...

Original: arXiv:2604.20370v1 Announce Type: new Abstract: Forecasting the life-cycle trajectory of a newly launched product is important for launch planning, resource allocation, and early risk assessment. Thi...

arxiv_cs_lg 2026/4/24

R2IF: Reasoning と決定をコンポジット報酬で整える、解釈可能な LLM 関数呼出しのためのコンポジション報酬に基づく学習

R2IF: Aligning Reasoning with Decisions via Composite Rewards for Interpretable LLM Function Calling

arXiv:2604.20316v1 Announce Type: new Abstract: 関数呼出しは、大規模言語モデル (LLM) に外部ツールとのインターフェースを提供しますが、既存の RL ベースのアプローチでは、推論プロセスとツール呼出しの決定との間に整合性の欠如が見られます。当論文では、解釈可能な関数呼出しのための推論感知型 RL フレームワークである R2IF を提案します。これ...

Original: arXiv:2604.20316v1 Announce Type: new Abstract: Function calling empowers large language models (LLMs) to interface with external tools, yet existing RL-based approaches suffer from misalignment betw...

arxiv_cs_lg 2026/4/24

LoRA によって誘発されるロジットシフトの形式化:技術的ノート

Formalising the Logit Shift Induced by LoRA: A Technical Note

arXiv:2604.20313v1 発表タイプ:新規 要約:本技術的ノートでは、Low-Rank Adaptation (LoRA) によって誘発されるロジットシフトおよびファクトマージンの変化について、第一次近似による形式化を提供します。基礎モデルの軌道において第一次 Fréchet 近似を用いることで、マルチレイヤー LoRA 効果を、レイヤーごとの寄与の線形和と、レイヤー間の相互作用を表す...

Original: arXiv:2604.20313v1 Announce Type: new Abstract: This technical note provides a first-order formalisation of the logit shift and fact-margin change induced by Low-Rank Adaptation (LoRA). Using a first...

arxiv_cs_lg 2026/4/24

SPD 多辺形上の接束神経ネットワーク:2 次幾何学的表現学習

Sheaf Neural Networks on SPD Manifolds: Second-Order Geometric Representation Learning

arXiv:2604.20308v1 Announce Type: new 要旨:グラフニューラルネットワークは、ユークリッド空間の線形構造に根ざした 2 つの根本的な課題に直面している。(1) 現在のアーキテクチャは、方向や勾配などの幾何学をベクトルとして表現しているが、多くのタスクでは原子の向きが如何に共変するかのような方向間の関係性を捉えることができる行列値表現が必要である。これらの 2 次...

Original: arXiv:2604.20308v1 Announce Type: new Abstract: Graph neural networks face two fundamental challenges rooted in the linear structure of Euclidean vector spaces: (1) Current architectures represent ge...

arxiv_cs_lg 2026/4/24

生成モデルを用いた合成飛行データ生成

Synthetic Flight Data Generation Using Generative Models

arXiv:2604.20293v1 Announce Type: new 要約:航空研究における合成データの採用増加は、データ不足と機密性に関する課題に対する有望な解決策をもたらしています。本研究では、生成モデルが生み出す現実的な合成飛行データの可能性を探り、その質を包括的な 4 つ段階の評価枠組みを通じて評価します。合成飛行データの必要性は、機密性の高い実世界記録の代替品として機能する可能性、...

Original: arXiv:2604.20293v1 Announce Type: new Abstract: The increasing adoption of synthetic data in aviation research offers a promising solution to data scarcity and confidentiality challenges. This study ...

arxiv_cs_lg 2026/4/24

飛行回避記録の不均衡データに対する生成拡張:飛行情報システムにおける多目的最適化フレームワーク

Generative Augmentation of Imbalanced Flight Records for Flight Diversion Prediction: A Multi-objective Optimisation Framework

arXiv:2604.20288v1 発表タイプ: 新しい 要約:飛行回避は航空において希少ではあるが高影響力の出来事であり、その予測は安全と運用効率にとって不可欠である。しかし、歴史記録におけるその希少性は、これらを検知する機械学習モデルの学習を妨げている。本研究は、この希少性のギャップに対し、生成モデルが合成的な回避記録を付加することで歴史飛行データを拡張し、モデル訓練を改善し予測精度を向上...

Original: arXiv:2604.20288v1 Announce Type: new Abstract: Flight diversions are rare but high-impact events in aviation, making their reliable prediction vital for both safety and operational efficiency. Howev...

arxiv_cs_lg 2026/4/24

神経表現における自己次元推定の再考

Rethinking Intrinsic Dimension Estimation in Neural Representations

arXiv:2604.20276v1 発表タイプ:新 要旨:神経表現の解析は、神経ネットワークの内部構造をより深く理解することを目指す研究において不可欠な要素となっています。神経表現を調査するさまざまなアプローチが存在しますが、重要な研究の一つは、内在次元 (ID) の視点を通じてそれを行うことに焦点を当てています。although これなる観点によって貴重な洞察が得られ、膨大な后继研究を刺激した...

Original: arXiv:2604.20276v1 Announce Type: new Abstract: The analysis of neural representation has become an integral part of research aiming to better understand the inner workings of neural networks. While ...

arxiv_cs_lg 2026/4/24

初期の急性腎機能障害の予測のための適応的ミューテーションロックを備えた Causal-Transformer

Causal-Transformer with Adaptive Mutation-Locking for Early Prediction of Acute Kidney Injury

arXiv:2604.20259v1 Announce Type: new 本文:急性腎機能障害(AKI)の早期正確な予測は、タイムリーな臨床介入に不可欠です。しかし、既存の深層学習モデルは不規則にサンプリングされたデータに対して困難に直面し、シーケンシャルアーキテクチャの「ブラックボックス」的な不透明性により、臨床の信頼に厳格に制限されています。これらの課題に対応するため、私たちは Causal...

Original: arXiv:2604.20259v1 Announce Type: new Abstract: Accurate early prediction of Acute Kidney Injury (AKI) is critical for timely clinical intervention. However, existing deep learning models struggle wi...

arxiv_cs_lg 2026/4/24

uLEAD-TabPFN: 条件付き依存関係の違反を検出する PFN ベースの不安定性感知型依存関係ベースのアノーマリー検出

uLEAD-TabPFN: Uncertainty-aware Dependency-based Anomaly Detection with TabPFN

arXiv:2604.20255v1 Announce Type: new 摘粋: テーブルデータの異常検出は、高次元性、複雑な特徴間の依存関係、および異質なノイズが存在するため挑戦的である。既存の多くの手法は近接性をベースとした手がかりに依存しており、複雑な特徴間の依存関係の違反により引き起こされる異常を検出することを見落としてしまう可能性が高い。依存関係ベースのアノーマリー検出は、異常を特徴...

Original: arXiv:2604.20255v1 Announce Type: new Abstract: Anomaly detection in tabular data is challenging due to high dimensionality, complex feature dependencies, and heterogeneous noise. Many existing metho...

arxiv_cs_lg 2026/4/24

ツーステージグラフスパージファシケーションを用いた巡回セールスマン問題における機械学習

Machine Learning for Two-Stage Graph Sparsification for the Travelling Salesman Problem

arXiv:2604.20236v1 発表タイプ:new 要約:高性能な TSP ソルバーである LKH は、すべてのエッジに対してではなく、スパージファシケーションされた候補グラフ内で探索を行います。グラフのスパージファシケーションは困難であり、エッジを過剰に保持するとソルバーは時間を浪費し、逆に過剰に削除すると最適ルートに属するエッジが失われます。二大ヒューリスティック手法である $\ ext...

Original: arXiv:2604.20236v1 Announce Type: new Abstract: High-performance TSP solvers like LKH search within a sparsified candidate graph rather than over all possible edges. Graph sparsification is non-trivi...

arxiv_cs_lg 2026/4/24

Deep Networks に対する幾何的階層近似速度 (Geometric Layer-wise Approximation Rates for Deep Networks)

Geometric Layer-wise Approximation Rates for Deep Networks

arXiv:2604.20219v1 Announce Type: new Abstract: 深層ニューラルネットワークの成功において深さは広く中心的存在と見なされているが、標準的なニューラルネットワークの近似理論は通常、最終出力に対する保証のみを提供し、中間層の役割については大まかに不明確である。我々は、このギャップに対処するために、深さが明確にスケール依存する解釈を受け入れる定量化枠組みを開...

Original: arXiv:2604.20219v1 Announce Type: new Abstract: Depth is widely viewed as a central contributor to the success of deep neural networks, whereas standard neural network approximation theory typically ...

arxiv_cs_lg 2026/4/24

Self-Guidance を用いた大規模な自己対戦の拡張

Scaling Self-Play with Self-Guidance

arXiv:2604.20209v1 Announce Type: new Abstract: LLM による自己対戦アルゴリズムは、原理上その学習には何の制約もない点が注目されています。推測者(Conjecturer)モデルが解き手(Solver)に課題を作成し、両者が共同で向上していきます。しかし、現実には既存の LLM 自己対戦手法は大量の計算資源と相まって良好に拡張できず、学習の平坦化に陥...

Original: arXiv:2604.20209v1 Announce Type: new Abstract: LLM self-play algorithms are notable in that, in principle, nothing bounds their learning: a Conjecturer model creates problems for a Solver, and both ...

arxiv_cs_lg 2026/4/24

ACT: Temporal Disentanglement と Structural Purification を介したクロスセクション株式ランキングのためのアンチクロスツークラーニング

ACT: Anti-Crosstalk Learning for Cross-Sectional Stock Ranking via Temporal Disentanglement and Structural Purification

arXiv:2604.20204v1 Announce Type: new 抽象:クロスセクション株式ランキングは、定量的投資における基本的なタスクであり、個別の株式の時系列モデリングと株式間の相互依存性の両方を依存しています。既存の深層学習モデルは、関係グラフ上での情報伝播によってランキング精度を向上させるグラフベースのアプローチを採用していますが、予測因子間の意図しない情報干渉であるクロスツ...

Original: arXiv:2604.20204v1 Announce Type: new Abstract: Cross-sectional stock ranking is a fundamental task in quantitative investment, relying on both temporal modeling of individual stocks and the capture ...

arxiv_cs_lg 2026/4/24

一般化拡散過程の一类に対する構造感受性バリエーション学習

Structure-Aware Variational Learning of a Class of Generalized Diffusions

arXiv:2604.20188v1 Announce Type: new 要旨:確率勾配システムの潜在エネルギーを、部分的かつノイズを含む観測から学習する問題は、物理学、化学、およびデータ駆動モデリングにおいて生じる基本的な問題です。従来の手法は、制御方程式や速度場の直接回帰に依存することが多く、これによりノイズや外部擾乱に対して感度が高く、観測データが不完全である場合に失敗してしまうことがあり...

Original: arXiv:2604.20188v1 Announce Type: new Abstract: Learning the underlying potential energy of stochastic gradient systems from partial and noisy observations is a fundamental problem arising in physics...

arxiv_cs_lg 2026/4/24

物理学強化型ディープラーニングを用いたリチウムイオン電池の能動的熱暴走予報

Physics-Enhanced Deep Learning for Proactive Thermal Runaway Forecasting in Li-Ion Batteries

arXiv:2604.20175v1 Announce Type: new 本文書(要約):リチウムイオン電池における熱暴走の高精度予測は、現代のエネルギー蓄積システムにおける安全性、効率、信頼性の確保にとって不可欠です。従来のデータ駆動型アプローチ、例えば長短期記憶(LSTM)ネットワークは、複雑な時間依存性を捉えることができますが、熱力学原理を違反することが多く、結果として物理的に整合性の取...

Original: arXiv:2604.20175v1 Announce Type: new Abstract: Accurate prediction of thermal runaway in lithium-ion batteries is essential for ensuring the safety, efficiency, and reliability of modern energy stor...

arxiv_cs_lg 2026/4/24

lever:サポート制約下での推論時政策再利用

Lever: Inference-Time Policy Reuse under Support Constraints

arXiv:2604.20174v1 発表タイプ:新規 要約:強化学習(RL)のポリシーは通常、固定された目的のために訓練されるため、タスク要件が変更された際に再利用が困難です。私たちが研究するのは、推論時の政策再利用です。あらかじめ訓練済みの政策のライブラリと新しい複合目的が与えられた場合、追加のエナジーボットとの相互作用なしに完全にオフラインで高品質なポリシーを構築できるでしょうか?私たちは、...

Original: arXiv:2604.20174v1 Announce Type: new Abstract: Reinforcement learning (RL) policies are typically trained for fixed objectives, making reuse difficult when task requirements change. We study inferen...

arxiv_cs_lg 2026/4/24

Cover は Robbins と出会い、有界データへのベットを賭けた時: 最悪ケース regret の $O( rac{ ext{ln} n}$) と、確率 1 regret の $O( ext{ln} ext{ln} n)$

Cover meets Robbins while Betting on Bounded Data: $\ln n$ Regret and Almost Sure $\ln\ln n$ Regret

arXiv:2604.20172v1 Announce Type: new 要旨:[0,1] のデータ列に対してベットを行う状況を考慮し、条件付き平均 $m_0 \in (0,1)$ が成り立つ場合、公平なベットであれば何を賭けてもよいとします。Cover のユニバーサルポートフォリオアルゴリズムは、後見における最適な定額ベットとの比較で最悪ケース regret が $O(\text{ln} n)...

Original: arXiv:2604.20172v1 Announce Type: new Abstract: Consider betting against a sequence of data in $[0,1]$, where one is allowed to make any bet that is fair if the data have a conditional mean $m_0 \in ...

arxiv_cs_lg 2026/4/24

SMART: Multi-Task Learning におけるスペクトル転移アプローチ

SMART: A Spectral Transfer Approach to Multi-Task Learning

arXiv:2604.20161v1 Announce Type: new 要約:マルチタスク学習は関連するアプリケーションにおいて有効ですが、ターゲットサンプル数が小さいと性能が低下します。転移学習は関連する研究から強みを借用する手法ですが、既存の多くの方法は源モデルとターゲットモデル間の制限された差(bounded-difference)の仮定に依存しています。本研究では、SMART というマ...

Original: arXiv:2604.20161v1 Announce Type: new Abstract: Multi-task learning is effective for related applications, but its performance can deteriorate when the target sample size is small. Transfer learning ...