3496 articles
移動型 MOBA ゲームにおける軽量 AI エージェントの蒸留を導く パレ托最適化パイプライン
Pareto-guided Pipeline for Distilling Featherweight AI Agents in Mobile MOBA Games
arXiv:2602.07521v1 発表タイプ:新規 摘要:最近のゲーム AI 技術の進展により、 Honor of Kings(以下 HoK)といった複雑な環境において、人間の上級プロフェッショナルを凌駕するエージェントの訓練が実現可能であることが示されています。しかし、このような強力なエージェントをモバイルデバイスに実装することは依然として重大な課題です。一方面、HoK の多式的状態表現と階...
Original: arXiv:2602.07521v1 Announce Type: new Abstract: Recent advances in game AI have demonstrated the feasibility of training agents that surpass top-tier human professionals in complex environments such ...
MedVerse: DAG 構造による並列実行を介した効率的かつ信頼性の高い医学推論
MedVerse: Efficient and Reliable Medical Reasoning via DAG-Structured Parallel Execution
論文 arXiv:2602.07529v1 発表 タイプ:新規 要旨:大規模言語モデル(LLM)は、幅広い医学推論タスクにおいて強力な性能と高速な進展を示しています。しかし、その順序論的 autoregressive(自己再帰的)デコードは、差異診断など本来に並列で行える臨床推論を単一の直線推論パスに強制し、複雑な医学問題における効率性と信頼性の両方を制限しています。これを解決するために、Pet...
Original: arXiv:2602.07529v1 Announce Type: new Abstract: Large language models (LLMs) have demonstrated strong performance and rapid progress in a wide range of medical reasoning tasks. However, their sequent...
コンパクトな準同型サブグラフ
Compact Conformal Subgraphs
arXiv:2602.07530v1 発表 タイプ:new 摘要:準同型予測は厳密な、分布に依存しない不確実性保証を提供しますが、経路計画、計画、順列推奨などの構造化されたドメインでは、しばしば不適切に大きな予測セットを出力します。私たちは「準同型圧縮」を導入しました。このフレームワークは、統計的な妥当性を保ちつつ構造的な複雑性を低減するコンパクトなサブグラフの構成方法を提供します。私たちは圧縮を...
Original: arXiv:2602.07530v1 Announce Type: new Abstract: Conformal prediction provides rigorous, distribution-free uncertainty guarantees, but often yields prohibitively large prediction sets in structured do...
Gaussian Match-and-Copy:変換器の誘導を調べるためのミニマルベンチマーク
Gaussian Match-and-Copy: A Minimalist Benchmark for Studying Transformer Induction
arXiv:2602.07562v1 発表種別:新規 要約:Match-and-copy は、大規模言語モデルが推論時にコンテキストから一致するトークンを検索し、その後続トークンをコピーするための核心的な検索 Primitive です。しかし、この行動が自然データにおいてどのように出現するかを理解するのは困難であり、検索と暗記は不可分になっています。この 2 つを分離するために、Gaussian...
Original: arXiv:2602.07562v1 Announce Type: new Abstract: Match-and-copy is a core retrieval primitive used at inference time by large language models to retrieve a matching token from the context then copy it...
Diversity-Driven Neural Network Ensemblesを用いた時系列分類の向上
Enhancing Time Series Classification with Diversity-Driven Neural Network Ensembles
arXiv:2602.07579v1 発表型:新 要約:アンサンブル手法は、個々のモデルが学習した特徴の多様性を活用することで、様々な機械学習タスクにおいて最先端(SOTA)のパフォーマンスを実現する上で決定的な役割を果たしてきました。時系列分類(TSC)において、アンサンブル手法はニューラルネットワーク(NN)ベースか、HIVE-COTE などの従来の手法であっても極めて有効であることが証明され...
Original: arXiv:2602.07579v1 Announce Type: new Abstract: Ensemble methods have played a crucial role in achieving state-of-the-art (SOTA) performance across various machine learning tasks by leveraging the di...
事前学習されたバリアショナルブリッジによる統合的生分子軌跡生成
Unified Biomolecular Trajectory Generation via Pretrained Variational Bridge
arXiv:2602.07588v1 Announce Type: new Abstract: 分子力学(MD)シミュレーションは、原子レベルの完全な分解能で分子の振る舞いを特徴づけるための基本的なツールを提供しますが、その応用は計算コストによって厳重に制限されています。これを解決するため、最近では効率的な軌跡生成のために粗い時間ステップでダイナミクスを学習するための多くのディープ・ジェネラティ...
Original: arXiv:2602.07588v1 Announce Type: new Abstract: Molecular Dynamics (MD) simulations provide a fundamental tool for characterizing molecular behavior at full atomic resolution, but their applicability...
アローの境を超へて:多基準ベンチマークにおける不可能性から多様性へ
Beyond Arrow: From Impossibility to Possibilities in Multi-Criteria Benchmarking
arXiv:2602.07593v1 Announcement Type: new 摘要:現代のベンチマーク(HELM, MMLU など)は、正確性、強健性、効率などの複数の指標を含んでいます。これらの指標を単一の順位へ変換しようと attempted すると、自然な集約手法が非整合的またはモデルのセットの変更に対して不安定になることがあります。我々はこれを集約の問題として形式化し、各指標がデータ...
Original: arXiv:2602.07593v1 Announce Type: new Abstract: Modern benchmarks such as HELM MMLU account for multiple metrics like accuracy, robustness and efficiency. When trying to turn these metrics into a sin...
Astro: アクティベーション導向構造正則化による外れ値頑健な LLM パストトレーニング量化
Astro: Activation-guided Structured Regularization for Outlier-Robust LLM Post-Training Quantization
Weight-only パストトレーニング量化(PTQ)は効率的な大規模言語モデル(LLM)デプロイメントにおいて不可欠であるが、重量とアクティベーションの外れ値による精度劣化を被る。既存の緩和戦略はしばしば重大な限界に直面している:外れ値抑制が不十分である場合が多いか、あるいは推論レイテンシ、重い前処理、あるいは複雑な演算子融合への依存といったデプロイメントの非効率性を招きうる。これらの限界を解...
Original: arXiv:2602.07596v1 Announce Type: new Abstract: Weight-only post-training quantization (PTQ) is crucial for efficient Large Language Model (LLM) deployment but suffers from accuracy degradation cause...
有理型伝送子 (Rational Transductors)
Rational Transductors
arXiv:2602.07599v1 発表 タイプ:new 要約:標準的な Transformer は語義モデリングでは優れていますが、硬直した順次論理や状態追跡には苦戦します。理論的な研究によると、自己注意力は(厳密な注意力の下では)$\\\\\\\\\\\\AC^0$クラス、(軟らかい注意力の下では)$\\\\\\\\\\\\TC^0$クラスに制限されており、中間の chain-of-thou...
Original: arXiv:2602.07599v1 Announce Type: new Abstract: Standard Transformers excel at semantic modeling but struggle with rigid sequential logic and state tracking. Theoretical work establishes that sel...
オブジェクト指向遷移モデル化と誘導論理学プログラミング
Object-Oriented Transition Modeling with Inductive Logic Programming
arXiv:2602.07602v1 Announce Type: new Abstract: 観察から世界のモデルを構築する(すなわち、誘導)ことは、機械学習における主要な課題の一つです。実用的なモデルは、新規な状況で使用された際に精度を維持し、すなわち一般化できる必要があります。また、解釈が容易で、効率的に学習可能なべきです。過去の研究は、人間の認知を着想として得たオブジェクト指向表現の文脈で...
Original: arXiv:2602.07602v1 Announce Type: new Abstract: Building models of the world from observation, i.e., induction, is one of the major challenges in machine learning. In order to be useful, models need ...
Backpropagation による Spectral Bias の回避:極端学習機を用いた高速な明示的ニューラル表現', 'contentJa': 'arXiv:2602.07603v1 Announce Type: new 抽象:明示的ニューラル表現(INR)の微細な詳細を捉えるためのトレーニングは、通常、反復的なバックプロパゲーションに頼り、目標が高度に不均一な周波数成分を持つ場合には、頻域バイアスによって妨げられることが多い。本稿では、反復的なバックプロパゲーションを必要としない ELM-INR を提案する。この手法は、領域を重なったサブ領域に分割し、各局所的な問題を極端学習機(ELM)を用いて閉じた形で適合させることで、反復的な最適化を安定した線形最小二乗解に置き換える。この設計により、局所予説を単位分割法を通じて結合することで、高速で数値的に堅牢な再構成が可能となる。固定された局所容量において近似的に困難となる箇所を理解するために、本手法を頻域 Barron 準則の視点から解析し、それは全球的な再構成誤差が高頻域複雑性を示す領域で支配的であることを明らかにした。この洞察に基づいて、容量制約下での再構成品質を向上させるための BEAM(適応的メッシュ補正戦略)を導入した。', 'tags': [
Escaping Spectral Bias without Backpropagation: Fast Implicit Neural Representations with Extreme Learning Machines
Original: arXiv:2602.07603v1 Announce Type: new Abstract: Training implicit neural representations (INRs) to capture fine-scale details typically relies on iterative backpropagation and is often hindered by sp...
SERE: 類似性に基づく専門家再ルーティングによる MoE モデルにおける効率的なバッチデコーディング
SERE: Similarity-based Expert Re-routing for Efficient Batch Decoding in MoE Models
Mixed-Of-Experts (MoE) アーキテクチャは、スパースアクティベーションを採用し、高密度の大規模言語モデル (LLM) に対しては高速かつ高精度なトレーニングおよび推論を実現します。しかし、本番サービング環境では、ハードウェア効率を最適化するためにバッチ推論が必要となり、それが不要な専門家のアクティベーションを招き、メモリー制限によるデコーディングステージを遅延させる要因となりま...
Original: arXiv:2602.07616v1 Announce Type: new Abstract: Mixture-of-Experts (MoE) architectures employ sparse activation to deliver faster training and inference with higher accuracy than dense LLMs. However,...
Dense Neural Networks are not Universal Approximators
arXiv:2602.07618v1 発表 タイプ:新 摘要:われわれは、密集型ニューラルネットワークの近似能力を調査した。一般化近似定理は、重み値の制限がない場合に、十分大きなアーキテクチャは任意の連続関数を近似できることを確立するが、われわれは密集型ニューラルネットワークがこのような普遍性を備えていないことを示した。わが議論は、弱相則と、前馈ネットワークをメッセージ伝達型グラフニューラルネット...
Original: arXiv:2602.07618v1 Announce Type: new Abstract: We investigate the approximation capabilities of dense neural networks. While universal approximation theorems establish that sufficiently large archit...
TASTE: 対石の操作を用いたタスク認識型の外れ値検出
TASTE: Task-Aware Out-of-Distribution Detection via Stein Operators
arXiv:2602.07640v1 公開タイプ: 新しい 要約:外れ値検出手法は、しばしば訓練入力分布からの偏離を検出するデータ中心のアプローチ(これがトレーニングされたモデルに与える影響を考慮していない場合がある)か、分類器の出力に依存するモデル中心のアプローチ(明示的なデータ幾何学の参照を含まない場合がある)であることが多い。当提案の TASTE(タスク認識型 対石の操作)は、対石と呼ばれる...
Original: arXiv:2602.07640v1 Announce Type: new Abstract: Out-of-distribution detection methods are often either data-centric, detecting deviations from the training input distribution irrespective of their ef...
Continuous Program Search
arXiv:2602.07659v1 Announce Type: new Abstract: Genetic Programming は解釈可能なプログラムを生み出すものの、微小的な構文変異が大きな予測不能な行動変化を引き起こし、局所性とサンプル効性を低下させることがある。我々はこれを演算子設計の問題として捉え、潜在空間における距離が行動の意味を持つように連続的なプログラム空間を学習させ、その...
Original: arXiv:2602.07659v1 Announce Type: new Abstract: Genetic Programming yields interpretable programs, but small syntactic mutations can induce large, unpredictable behavioral shifts, degrading locality ...
Surprisal-Guided Selection: Compute-Optimal Test-Time Strategies for Execution-Grounded Code Generation
arXiv:2602.07670v1 Announce Type: new 摘要:テストタイムトレーニング(TTT)は、推論時に勾配ベースの更新を通じて言語モデルを適応させる手法です。しかし、適応が適切な戦略なのかどうかは疑問です。我々は、検証可能な実行基礎(VEG)タスク、例としては GPU カーネル最適化など、決定論的な評価者が密集した連続的な報酬シグナルを提供するドメイン向けに、計算効率の高...
Original: arXiv:2602.07670v1 Announce Type: new Abstract: Test-time training (TTT) adapts language models through gradient-based updates at inference. But is adaptation the right strategy? We study compute-opt...
分布シフトとドリフトを考慮したプロフィールマッピング付きフェデレーテッド学習
Federated Learning with Profile Mapping under Distribution Shifts and Drifts
arXiv:2602.07671v1 Announce Type: new フェデレーテッド学習(FL)は、生データを共有せずにクライアント間での分散モデルトレーニングを可能にしますが、実際のデータ異質性下ではパフォーマンスが低下します。既存の方法は、クライアント間の分布シフトや時間経過に伴う分布ドリフトに対応できておらず、あるいはクライアントクラスターの数やデータ異質性の類型など現実的な前提を...
Original: arXiv:2602.07671v1 Announce Type: new Abstract: Federated Learning (FL) enables decentralized model training across clients without sharing raw data, but its performance degrades under real-world dat...
ElliCE: Rashomon 集合を楕円体の近似で最適化する確定的に頑健なアルゴリズム的帰結
ElliCE: Efficient and Provably Robust Algorithmic Recourse via the Rashomon Sets
arXiv:2602.07674v1 発表タイプ:新規 要約:機械学習モデルはすでに、人々の生活に直接影響を与える決定に影響を与えており、予測だけでなく、個人がより良い結果を得るためにどのように行動すべきかという理解も重要となってきた。アルゴリズム的帰結(algorithmic recourse)は、より好ましい結果を取得するために実行可能な入力変更を提供するもので、通常、近傍説明文(count...
Original: arXiv:2602.07674v1 Announce Type: new Abstract: Machine learning models now influence decisions that directly affect people's lives, making it important to understand not only their predictions, but ...
Spectral Gating Networks
arXiv:2602.07679v1 Announce Type: new 摘要:ゲート機構は至るところに見られますが、前向きネットワークにおける補完的な問いが十分に研究されていません。それは、安定性とスケーラビリティを犠牲にしてはいないかながら、周波数豊かな表現力をどのように導入すべきかという問いです。この緊張関係は、グリッドの细化をパラメータ増加と高精度な最適化の脆弱性を引き起こすスプラインに...
Original: arXiv:2602.07679v1 Announce Type: new Abstract: Gating mechanisms are ubiquitous, yet a complementary question in feed-forward networks remains under-explored: how to introduce frequency-rich express...
予測符号ネットワークの無限的な幅と深度の限界について
On the Infinite Width and Depth Limits of Predictive Coding Networks
arXiv:2602.07697v1 発表タイプ: 新しい 要旨: 予測符号(PC)は、標準的なバックプロパゲーション(BP)への生生物学的合理的な代替であり、重みを更新する前にネットワークの活動に対してエネルギー関数を最小化します。最近の研究は、BP による再パラメトリゼーションを活用することで、深層 PC ネットワーク(PCN)のトレーニング安定性を向上させています。しかし、これらのアプロー...
Original: arXiv:2602.07697v1 Announce Type: new Abstract: Predictive coding (PC) is a biologically plausible alternative to standard backpropagation (BP) that minimises an energy function with respect to netwo...