3496 articles

arxiv_cs_lg 2026/4/24

COMPASS: 適応的な意味サンプルを用いた連続型多言語 PEFT

COMPASS: COntinual Multilingual PEFT with Adaptive Semantic Sampling

arXiv:2604.20720v1 Announce Type: new 大規模言語モデル（LLMs）は、言語間で性能の差異を示し、単純な多言語微調は、負の相互言語干渉のために性能を低下させることがよくあります。これを解決するために、我々は COMPASS（COntinual Multilingual PEFT with Adaptive Semantic Sampling）を導入しました。こ...

Original: arXiv:2604.20720v1 Announce Type: new Abstract: Large language models (LLMs) often exhibit performance disparities across languages, with naive multilingual fine-tuning frequently degrading performan...

arxiv_cs_lg 2026/4/24

自然システムのデジタルツインにおけるモデル適応用の生成型フローネットワーク

Generative Flow Networks for Model Adaptation in Digital Twins of Natural Systems

arXiv:2604.20707v1 Announce Type: new Abstract: 自然システムのデジタルツインは、時間とともに変化し、部分的にしか観測されず、かつパラメータが直接測定できない機械的シミュレーターによって一般的にモデル化される、物理システムとの整合性を維持する必要があります。そのような状況において、モデル適応は自然にシミュレーションに基づく推論問題として設定されます。た...

Original: arXiv:2604.20707v1 Announce Type: new Abstract: Digital twins of natural systems must remain aligned with physical systems that evolve over time, are only partially observed, and are typically modele...

arxiv_cs_lg 2026/4/24

StormNet: GNN に基づいた空間時間偏微预报モデルによる暴潮予測の向上

StormNet: Improving storm surge predictions with a GNN-based spatio-temporal offset forecasting model

arXiv:2604.20688v2 Announce Type: new Abstract: 暴潮予報は、熱帯低気圧の影響を沿岸地域に及ぼす影響を軽減する上で依然として重大な課題であり、特に近年の急速な強度増大と沿岸部の活動増加という傾向を考慮する際にその重要性が際立っています。従来の高精度な数値モデルである ADCIRC は堅固ですが、多様な要因から生じる不可避免的な不確実性によりしばしば制約...

Original: arXiv:2604.20688v2 Announce Type: new Abstract: Storm surge forecasting remains a critical challenge in mitigating the impacts of tropical cyclones on coastal regions, particularly given recent trend...

arxiv_cs_lg 2026/4/24

MGDA-Decoupled: DPO ベースの LLM 対齐に向けた幾何学的な多目標最適化

MGDA-Decoupled: Geometry-Aware Multi-Objective Optimisation for DPO-based LLM Alignment

arXiv:2604.20685v1 Announce Type: new Abstract: 大規模言語モデル（LLM）を望ましい人類の価値に合わせるには、有用性、真実性、無害性など、互いに矛盾する可能性がある複数の目標を調整する必要があります。これは多目標最適化の課題を提示します。多くの対齐パイプラインは、これらの目標の固定的なスカラー化に基づいており、これにより最適化が困難または少数派の目標...

Original: arXiv:2604.20685v1 Announce Type: new Abstract: Aligning large language models (LLMs) to desirable human values requires balancing multiple, potentially conflicting objectives such as helpfulness, tr...

arxiv_cs_lg 2026/4/24

分散が重要でない：マルチモデル規模におけるトランスフォーマー圧縮構造的分析

Variance Is Not Importance: Structural Analysis of Transformer Compressibility Across Model Scales

arXiv:2604.20682v1 Announce Type: new 摘要：私たちは、GPT-2（124M パラメータ）および Mistral 7B（7.24B パラメータ）を対象とした 40 以上の実験を通じて、トランスフォーマー圧縮の系統的な実証的研究を提示します。当分析は、スペクトル圧縮、ブロックレベルの関数置換、回転ベースの量子化、アクティブーション幾何学、そして適応的早期退避を網羅...

Original: arXiv:2604.20682v1 Announce Type: new Abstract: We present a systematic empirical study of transformer compression through over 40 experiments on GPT-2 (124M parameters) and Mistral 7B (7.24B paramet...

arxiv_cs_lg 2026/4/24

線形神経イメージングモデルの臨床的解釈可能性向上のための特徴白化

Improving clinical interpretability of linear neuroimaging models through feature whitening

arXiv:2604.20675v1 Announce Type: new 要約：線形モデルは、脳疾患に関連するバイオマーカーを特定するために計算神経イメージングにおいて広く使用されています。しかし、学習された重みに対する解釈は依然として困難であり、臨床的に意味のある洞察を与えられないことがあります。この課題の一部は、脳領域間の内在的な相関から生じており、これにより線形重みは領域固有の寄与ではな...

Original: arXiv:2604.20675v1 Announce Type: new Abstract: Linear models are widely used in computational neuroimaging to identify biomarkers associated with brain pathologies. However, interpreting the learned...

arxiv_cs_lg 2026/4/24

GRPO-VPS: 検証可能なプロセス監督によるグループ相対的行動最適化の強化で実現した効果的な推論

GRPO-VPS: Enhancing Group Relative Policy Optimization with Verifiable Process Supervision for Effective Reasoning

arXiv:2604.20659v1 発表タイプ：新規摘要：検証可能な報酬を特徴とする強化学習（RLVR）は、学習された報酬モデルに代わり直接の出力検証を利用することで、大規模言語モデル（LLM）の推論能力を進歩させました。このパラダイムを踏まえ、グループ相対的行動最適化（GRPO）は批評子モデルの必要性を排除しましたが、中間ステップへの信用配分が indiscriminate（任意的）であるた...

Original: arXiv:2604.20659v1 Announce Type: new Abstract: Reinforcement Learning with Verifiable Rewards (RLVR) has advanced the reasoning capabilities of Large Language Models (LLMs) by leveraging direct outc...

arxiv_cs_lg 2026/4/24

Occupancy Reward Shaping: Offline Goal-Conditioned Reinforcement Learning における Credit Assignment の向上

Occupancy Reward Shaping: Improving Credit Assignment for Offline Goal-Conditioned Reinforcement Learning

arXiv:2604.20627v1 Announce Type: new 摘要：行動とその長期的な結果との時間的なラグは、データから目的指向的な行動を学習する際に Credit Assignment を困難にします。生成世界モデルはエージェントが訪問しうる将来の状態の分布を捉え、時間情報を捉えていることを示しています。その時間情報をどのように抽出して Credit Assignment を行...

Original: arXiv:2604.20627v1 Announce Type: new Abstract: The temporal lag between actions and their long-term consequences makes credit assignment a challenge when learning goal-directed behaviors from data. ...

arxiv_cs_lg 2026/4/24

Sharpness と確信度の両極性：カルイブラーションが曲率を追い抜く時

Too Sharp, Too Sure: When Calibration Follows Curvature

arXiv:2604.20614v1 Announce Type: new 摘要：現代のニューラルネットワークは高い精度を達成しつつも、十分にカルイブレーション（calibration）されていないままあり、確信度の推計が経験的な正しさと一致しないことがあります。しかし、カルイブラーションはしばしば事後の属性として扱われます。われわれは異なる視点を取り、カルイブラーションを小さな視覚タスクにおける...

Original: arXiv:2604.20614v1 Announce Type: new Abstract: Modern neural networks can achieve high accuracy while remaining poorly calibrated, producing confidence estimates that do not match empirical correctn...

arxiv_cs_lg 2026/4/24

プライバシー保護初期化と正規性に基づく集合化を備えた微分プライバシー付き集約連方学習

Differentially Private Clustered Federated Learning with Privacy-Preserving Initialization and Normality-Driven Aggregation

arXiv:2604.20596v1 発表タイプ：新要旨：連方学習（FL）は、元データを端末デバイスに保持しながらグローバルモデルのトレーニングを可能にする。にもかかわらず、FL は機密性のあるユーザー情報の漏洩を示すことがあり、実践的には、参加者に形式的なプライバシー保証を与えるために、微分プライバシー（DP）や安全ベクトル和などの手法と組み合わせて用いられる。現実的なクロスデバイス環境では、...

Original: arXiv:2604.20596v1 Announce Type: new Abstract: Federated learning (FL) enables training of a global model while keeping raw data on end-devices. Despite this, FL has shown to leak private user infor...

arxiv_cs_lg 2026/4/24

階層的 MARL 基盤に基づく DER の協調された小売 P2P 取引と発電側市場への参加アプローチ

A Hierarchical MARL-Based Approach for Coordinated Retail P2P Trading and Wholesale Market Participation of DERs

arXiv:2604.20586v1 告知タイプ: 新しいアブストラクト: 電気エネルギーセクターの分散化への継続的なシフト、これは最終利用セクターへの電気化の拡大と分散型エネルギー資源（DER）の広範な採用によって駆動され、これはグリッド運営をサポートするために DER の電気市場への能動的な参加を必要としています。さらに、二方向のエネルギーおよび通信フローが標準化されている現在、知的で容易に...

Original: arXiv:2604.20586v1 Announce Type: new Abstract: The ongoing shift towards decentralization of the electric energy sector, driven by the growing electrification across end-use sectors, and widespread ...

arxiv_cs_lg 2026/4/24

高次元の密度推定と情報推定のためのアモーティザード・ヴィン・コパラ

Amortized Vine Copulas for High-Dimensional Density and Information Estimation

arXiv:2604.20568v1 発表タイプ：新しい要旨：高次元の相互依存性をモデル化しつつ尤値の扱いやすさを保つことはまだ挑戦的である。古典的なヴィン・コパラパイプラインは解釈が可能であるがコストが高く、多くのニューラル推定子は柔軟だが構造化されていない。この作業において、我々はヴィン・ノイズ消去コパラ（VDC）を提案する。これは、単一のバイ変量ノイズ消去モデルを訓練し、それをヴィンのすべ...

Original: arXiv:2604.20568v1 Announce Type: new Abstract: Modeling high-dimensional dependencies while keeping likelihoods tractable remains challenging. Classical vine-copula pipelines are interpretable but c...

arxiv_cs_lg 2026/4/24

明瞭なドロップアウト：トランスフォーマーアーキテクチャのための確定的正規化

Explicit Dropout: Deterministic Regularization for Transformer Architectures

arXiv:2604.20505v1 Announce Type: new 要旨：ドロップアウトは深層学習において広く用いられている正規化手法であるが、その効果は通常、確率的なマスキングを通じて実現されているに過ぎず、明示的な最適化目標には含まれていない。本稿では、ドロップアウトを訓練損失に直接組み込まれた加法的正則化項として記述する確定的な形式を提案する。この枠組みでは、アテンションのクエリ、キ...

Original: arXiv:2604.20505v1 Announce Type: new Abstract: Dropout is a widely used regularization technique in deep learning, but its effects are typically realized through stochastic masking rather than expli...

arxiv_cs_lg 2026/4/24

決定論的に解析された切断されたデコードツリーの探索による効率的な推論時推論

Efficient Test-Time Inference via Deterministic Exploration of Truncated Decoding Trees

arXiv:2604.20500v1 発表タイプ：新要旨：自己整合性手法は、複数の推論経路を並列にサンプリングし投票を行うことで推論時のパフォーマンス向上をもたらします。しかし、数学やコーディングなど制約されたドメインでは、この手法は置換サンプリングにより確率の高い接頭辞や重複する完了を繰り返し再訪れるため計算効率が低下します。我々は、切断されたサンプリングを剪定されたデコードツリーの上での透過...

Original: arXiv:2604.20500v1 Announce Type: new Abstract: Self-consistency boosts inference-time performance by sampling multiple reasoning traces in parallel and voting. However, in constrained domains like m...

arxiv_cs_lg 2026/4/24

Machine-Learned Orbital-Free Density Functional Theoryのための代替関数

Surrogate Functionals for Machine-Learned Orbital-Free Density Functional Theory

arXiv:2604.20458v1 Announcement Type: new Abstract: 私らは、軌道なし密度関数理論（OF-DFT）のための代替関数、すなわち機械学習されたエネルギー関数を導入する。これらの関数は、物理的な参照との普遍的な忠実性によって定義されるのではなく、単に密度の最適化手法を用いて固定された手順を実行することで、本質的な基底状態の密度を生成することを要求するのみ...

Original: arXiv:2604.20458v1 Announce Type: new Abstract: We introduce surrogate functionals: machine-learned energy functionals for orbital-free density functional theory (OF-DFT) which are defined not by uni...

arxiv_cs_lg 2026/4/24

安定性の境縁の起源

The Origin of Edge of Stability

arXiv:2604.20446v1 発表タイプ: 新作要旨: ニューラルネットワークに対する全バッチ勾配降下法は、最大ヒessian 固有値を学習率 $\eta$ の $2/\eta$ 閾値に追いやります。この現象は「安定性の境縁」であり、統一的な説明を与えにくかった：既存の説明は境縁近傍での自己調整は確立されているものの、任意の初期化からなぜ軌跡が $2/\eta$ へと追い込まれるかという...

Original: arXiv:2604.20446v1 Announce Type: new Abstract: Full-batch gradient descent on neural networks drives the largest Hessian eigenvalue to the threshold $2/\eta$, where $\eta$ is the learning rate. This...

arxiv_cs_lg 2026/4/24

予測市場の予測経済への鍵となるデータセットセット：予測市場のフルライフサイクルのために [実験と分析]

Unlocking the Forecasting Economy: A Suite of Datasets for the Full Lifecycle of Prediction Market: [Experiments \& Analysis]

arXiv:2604.20421v1 発表タイプ：新規摘要：予測市場は、大統領選挙などの将来の事象に対する主張を取引する市場であり、その価格は集団の信念に continuously 更新されたシグナルを提供します。分散型プラットフォームである Polymarket では、市場ライフサイクルは市場作成、トークン登録、取引、オルクルとのインタラクション、紛争、そして最終的な決済を含みます。しかし、対...

Original: arXiv:2604.20421v1 Announce Type: new Abstract: Prediction markets are markets for trading claims on future events, such as presidential elections, and their prices provide continuously updated signa...

arxiv_cs_lg 2026/4/24

スケーラブルな AI インフェレンス：AI モデルセービングのパフォーマンス分析と最適化

Scalable AI Inference: Performance Analysis and Optimization of AI Model Serving

arXiv:2604.20420v1 Announce Type: new 要旨：AI 研究はモデル設計やアルゴリズムの性能に焦点を当てがちがうに、デプロイやインフェレンスは実世界での利用が不可欠であるにもかかわらず比較的探求されていません。本調査では、graphworks.ai と協力して開発されたスケーラブルなモデルセービング用の BentoML ベースの AI インフェレンスシステムの性能と...

Original: arXiv:2604.20420v1 Announce Type: new Abstract: AI research often emphasizes model design and algorithmic performance, while deployment and inference remain comparatively underexplored despite being ...

arxiv_cs_lg 2026/4/24

条件リスクのキャリブレーション

Calibrating conditional risk

arXiv:2604.20409v1 Announce Type: new 摘要：我々は、入力特徴条件付きでの予測モデルの損失期待値を推定することを含む条件リスクキャリブレーションの問題を導入・研究しました。これについては、分類および回帰の両方の設定で分析を行い、これが標準的な回帰タスクと本質的に同等であることを示しました。分類設定では、条件リスクキャリブレーションと個別/条件付き確率キャリブレ...

Original: arXiv:2604.20409v1 Announce Type: new Abstract: We introduce and study the problem of calibrating conditional risk, which involves estimating the expected loss of a prediction model conditional on in...

arxiv_cs_lg 2026/4/24

部分的に観測可能な電力分布網における不具合定位における時空間グラフニューラルネットワークの頑健性

Robustness of Spatio-temporal Graph Neural Networks for Fault Location in Partially Observable Distribution Grids

arXiv:2604.20403v1 Announce Type: new 摘要：電力分布網における不具合定位は、信頼性と停電時間の最小化において不可欠である。しかし、観測インフラの稀疏性による部分的な観測可能性のため、依然として困難な課題である。最近の研究では、時空間学習のために再帰ニューラルネットワーク (RNN) とグラフニューラルネットワーク (GNN) を組み合わせることによって有望な結...

Original: arXiv:2604.20403v1 Announce Type: new Abstract: Fault location in distribution grids is critical for reliability and minimizing outage durations. Yet, it remains challenging due to partial observabil...