12901 articles
イスラエルにおける地下水塩害のための AI ドライブ予測モデル
AI-Driven Predictive Modelling for Groundwater Salinization in Israel
arXiv:2602.07478v1 告知タイプ:新規 要旨:世界的な多くの地域で、地下水の塩分増加と汚染は深刻な課題であり、水資源の劣化を引き起こしています。本作業の目的は、地下水塩害の根因要因に対する包括的な理解を構築し、塩分の主要な気象、地質、および人類的な動向を同定することです。私たちは異なる潜在共変量のデータセットを統合し、ランダムフォレスト(RF)、XGBoost、ニューラルネットワー...
Original: arXiv:2602.07478v1 Announce Type: new Abstract: Increasing salinity and contamination of groundwater is a serious issue in many parts of the world, causing degradation of water resources. The aim of ...
ODELoRA: 常微分方程式を用いた低ランク適応のトレーニング
ODELoRA: Training Low-Rank Adaptation by Solving Ordinary Differential Equations
arXiv:2602.07479v1 Announce Type: new 要約:低ランク適応 (LoRA) は、適応行列上の Burer-Monteiro 因子分解によりトレーニング可能なパラメータ数の減少とメモリ要件の低減をもたらしたため、ディープ・トランスファー・ラーニングにおいて広く採用されたパラメータ効率的な微調整手法となっています。しかし、古典的な LoRA トレーニング手法は低ランク...
Original: arXiv:2602.07479v1 Announce Type: new Abstract: Low-rank adaptation (LoRA) has emerged as a widely adopted parameter-efficient fine-tuning method in deep transfer learning, due to its reduced number ...
自然言語の統計から神経ネットのスケール解析則を導き出す
Deriving Neural Scaling Laws from the statistics of natural language
arXiv:2602.07488v1 Announce Type: new **要約**:実験的な神経ネットのスケール解析則は、大規模機械学習の経験的成果を著しく導き込んだにもかかわらず、どのモダンな自然言語データセットで訓練された LLM(大規模言語モデル)のこれらの重要な解析則の指数を定量的に予測できる理論は存在しません。本稿では、データ制限されたスケール解析則の場面で初めてのそのような理論...
Original: arXiv:2602.07488v1 Announce Type: new Abstract: Despite the fact that experimental neural scaling laws have substantially guided empirical progress in large-scale machine learning, no existing theory...
非反復型マルチパス神経ネットワークにおける超パラメータ移転の法則
Hyperparameter Transfer Laws for Non-Recurrent Multi-Path Neural Networks
arXiv:2602.07494v1 Announce Type: new 要約: 深く設計された現代のアーキテクチャの訓練は高コストであり、高価な繰り返し調整に比して超パラメータの移転の方が望ましい。最大更新パラメトリゼーション($ ext{maximal update parametrization, } \mu\text{P}$)は、多くの超パラメータが幅(width)の間で移転される理由を...
Original: arXiv:2602.07494v1 Announce Type: new Abstract: Deeper modern architectures are costly to train, making hyperparameter transfer preferable to expensive repeated tuning. Maximal Update Parametrization...
CoMI-IRL:コントラスタティブ・マルチ・インテンション・インバーズ・リファインメント学習
CoMI-IRL: Contrastive Multi-Intention Inverse Reinforcement Learning
arXiv:2602.07496v1 発表 タイプ: 新しい アブストラクト:インバーズ・リファインメント学習(IRL)は、エキスパートのデモから報酬関数を推論することを目的としています。複数の異なる意図を持つエキスパートがデモを提供する場合、これをマルチ・インテンション・IRL(MI-IRL)と呼びます。最近の深層生成 MI-IRLのアプローチは行動クラスタリングと報酬学習を組み合わせています...
Original: arXiv:2602.07496v1 Announce Type: new Abstract: Inverse Reinforcement Learning (IRL) seeks to infer reward functions from expert demonstrations. When demonstrations originate from multiple experts wi...
PALMS: Pavlovian Associative Learning Models Simulator
シミュレーションは、理論の構築と精査のサイクルにおいて不可欠なステップであり、研究者在適切な定義の構築、モデルの生成、そして正確な予測の作成を支援します。本論文では、パブロビアン条件付け実験をシミュレートするための Python 環境である Pavlovian Associative Learning Models Simulator (PALMS) を導入します。標準的な Rescorla-Wa...
Original: arXiv:2602.07519v1 Announce Type: new Abstract: Simulations are an indispensable step in the cycle of theory development and refinement, helping researchers formulate precise definitions, generate mo...
移動型 MOBA ゲームにおける軽量 AI エージェントの蒸留を導く パレ托最適化パイプライン
Pareto-guided Pipeline for Distilling Featherweight AI Agents in Mobile MOBA Games
arXiv:2602.07521v1 発表タイプ:新規 摘要:最近のゲーム AI 技術の進展により、 Honor of Kings(以下 HoK)といった複雑な環境において、人間の上級プロフェッショナルを凌駕するエージェントの訓練が実現可能であることが示されています。しかし、このような強力なエージェントをモバイルデバイスに実装することは依然として重大な課題です。一方面、HoK の多式的状態表現と階...
Original: arXiv:2602.07521v1 Announce Type: new Abstract: Recent advances in game AI have demonstrated the feasibility of training agents that surpass top-tier human professionals in complex environments such ...
MedVerse: DAG 構造による並列実行を介した効率的かつ信頼性の高い医学推論
MedVerse: Efficient and Reliable Medical Reasoning via DAG-Structured Parallel Execution
論文 arXiv:2602.07529v1 発表 タイプ:新規 要旨:大規模言語モデル(LLM)は、幅広い医学推論タスクにおいて強力な性能と高速な進展を示しています。しかし、その順序論的 autoregressive(自己再帰的)デコードは、差異診断など本来に並列で行える臨床推論を単一の直線推論パスに強制し、複雑な医学問題における効率性と信頼性の両方を制限しています。これを解決するために、Pet...
Original: arXiv:2602.07529v1 Announce Type: new Abstract: Large language models (LLMs) have demonstrated strong performance and rapid progress in a wide range of medical reasoning tasks. However, their sequent...
コンパクトな準同型サブグラフ
Compact Conformal Subgraphs
arXiv:2602.07530v1 発表 タイプ:new 摘要:準同型予測は厳密な、分布に依存しない不確実性保証を提供しますが、経路計画、計画、順列推奨などの構造化されたドメインでは、しばしば不適切に大きな予測セットを出力します。私たちは「準同型圧縮」を導入しました。このフレームワークは、統計的な妥当性を保ちつつ構造的な複雑性を低減するコンパクトなサブグラフの構成方法を提供します。私たちは圧縮を...
Original: arXiv:2602.07530v1 Announce Type: new Abstract: Conformal prediction provides rigorous, distribution-free uncertainty guarantees, but often yields prohibitively large prediction sets in structured do...
Gaussian Match-and-Copy:変換器の誘導を調べるためのミニマルベンチマーク
Gaussian Match-and-Copy: A Minimalist Benchmark for Studying Transformer Induction
arXiv:2602.07562v1 発表種別:新規 要約:Match-and-copy は、大規模言語モデルが推論時にコンテキストから一致するトークンを検索し、その後続トークンをコピーするための核心的な検索 Primitive です。しかし、この行動が自然データにおいてどのように出現するかを理解するのは困難であり、検索と暗記は不可分になっています。この 2 つを分離するために、Gaussian...
Original: arXiv:2602.07562v1 Announce Type: new Abstract: Match-and-copy is a core retrieval primitive used at inference time by large language models to retrieve a matching token from the context then copy it...
Diversity-Driven Neural Network Ensemblesを用いた時系列分類の向上
Enhancing Time Series Classification with Diversity-Driven Neural Network Ensembles
arXiv:2602.07579v1 発表型:新 要約:アンサンブル手法は、個々のモデルが学習した特徴の多様性を活用することで、様々な機械学習タスクにおいて最先端(SOTA)のパフォーマンスを実現する上で決定的な役割を果たしてきました。時系列分類(TSC)において、アンサンブル手法はニューラルネットワーク(NN)ベースか、HIVE-COTE などの従来の手法であっても極めて有効であることが証明され...
Original: arXiv:2602.07579v1 Announce Type: new Abstract: Ensemble methods have played a crucial role in achieving state-of-the-art (SOTA) performance across various machine learning tasks by leveraging the di...
事前学習されたバリアショナルブリッジによる統合的生分子軌跡生成
Unified Biomolecular Trajectory Generation via Pretrained Variational Bridge
arXiv:2602.07588v1 Announce Type: new Abstract: 分子力学(MD)シミュレーションは、原子レベルの完全な分解能で分子の振る舞いを特徴づけるための基本的なツールを提供しますが、その応用は計算コストによって厳重に制限されています。これを解決するため、最近では効率的な軌跡生成のために粗い時間ステップでダイナミクスを学習するための多くのディープ・ジェネラティ...
Original: arXiv:2602.07588v1 Announce Type: new Abstract: Molecular Dynamics (MD) simulations provide a fundamental tool for characterizing molecular behavior at full atomic resolution, but their applicability...
アローの境を超へて:多基準ベンチマークにおける不可能性から多様性へ
Beyond Arrow: From Impossibility to Possibilities in Multi-Criteria Benchmarking
arXiv:2602.07593v1 Announcement Type: new 摘要:現代のベンチマーク(HELM, MMLU など)は、正確性、強健性、効率などの複数の指標を含んでいます。これらの指標を単一の順位へ変換しようと attempted すると、自然な集約手法が非整合的またはモデルのセットの変更に対して不安定になることがあります。我々はこれを集約の問題として形式化し、各指標がデータ...
Original: arXiv:2602.07593v1 Announce Type: new Abstract: Modern benchmarks such as HELM MMLU account for multiple metrics like accuracy, robustness and efficiency. When trying to turn these metrics into a sin...
Astro: アクティベーション導向構造正則化による外れ値頑健な LLM パストトレーニング量化
Astro: Activation-guided Structured Regularization for Outlier-Robust LLM Post-Training Quantization
Weight-only パストトレーニング量化(PTQ)は効率的な大規模言語モデル(LLM)デプロイメントにおいて不可欠であるが、重量とアクティベーションの外れ値による精度劣化を被る。既存の緩和戦略はしばしば重大な限界に直面している:外れ値抑制が不十分である場合が多いか、あるいは推論レイテンシ、重い前処理、あるいは複雑な演算子融合への依存といったデプロイメントの非効率性を招きうる。これらの限界を解...
Original: arXiv:2602.07596v1 Announce Type: new Abstract: Weight-only post-training quantization (PTQ) is crucial for efficient Large Language Model (LLM) deployment but suffers from accuracy degradation cause...
有理型伝送子 (Rational Transductors)
Rational Transductors
arXiv:2602.07599v1 発表 タイプ:new 要約:標準的な Transformer は語義モデリングでは優れていますが、硬直した順次論理や状態追跡には苦戦します。理論的な研究によると、自己注意力は(厳密な注意力の下では)$\\\\\\\\\\\\AC^0$クラス、(軟らかい注意力の下では)$\\\\\\\\\\\\TC^0$クラスに制限されており、中間の chain-of-thou...
Original: arXiv:2602.07599v1 Announce Type: new Abstract: Standard Transformers excel at semantic modeling but struggle with rigid sequential logic and state tracking. Theoretical work establishes that sel...
オブジェクト指向遷移モデル化と誘導論理学プログラミング
Object-Oriented Transition Modeling with Inductive Logic Programming
arXiv:2602.07602v1 Announce Type: new Abstract: 観察から世界のモデルを構築する(すなわち、誘導)ことは、機械学習における主要な課題の一つです。実用的なモデルは、新規な状況で使用された際に精度を維持し、すなわち一般化できる必要があります。また、解釈が容易で、効率的に学習可能なべきです。過去の研究は、人間の認知を着想として得たオブジェクト指向表現の文脈で...
Original: arXiv:2602.07602v1 Announce Type: new Abstract: Building models of the world from observation, i.e., induction, is one of the major challenges in machine learning. In order to be useful, models need ...
Backpropagation による Spectral Bias の回避:極端学習機を用いた高速な明示的ニューラル表現', 'contentJa': 'arXiv:2602.07603v1 Announce Type: new 抽象:明示的ニューラル表現(INR)の微細な詳細を捉えるためのトレーニングは、通常、反復的なバックプロパゲーションに頼り、目標が高度に不均一な周波数成分を持つ場合には、頻域バイアスによって妨げられることが多い。本稿では、反復的なバックプロパゲーションを必要としない ELM-INR を提案する。この手法は、領域を重なったサブ領域に分割し、各局所的な問題を極端学習機(ELM)を用いて閉じた形で適合させることで、反復的な最適化を安定した線形最小二乗解に置き換える。この設計により、局所予説を単位分割法を通じて結合することで、高速で数値的に堅牢な再構成が可能となる。固定された局所容量において近似的に困難となる箇所を理解するために、本手法を頻域 Barron 準則の視点から解析し、それは全球的な再構成誤差が高頻域複雑性を示す領域で支配的であることを明らかにした。この洞察に基づいて、容量制約下での再構成品質を向上させるための BEAM(適応的メッシュ補正戦略)を導入した。', 'tags': [
Escaping Spectral Bias without Backpropagation: Fast Implicit Neural Representations with Extreme Learning Machines
Original: arXiv:2602.07603v1 Announce Type: new Abstract: Training implicit neural representations (INRs) to capture fine-scale details typically relies on iterative backpropagation and is often hindered by sp...
SERE: 類似性に基づく専門家再ルーティングによる MoE モデルにおける効率的なバッチデコーディング
SERE: Similarity-based Expert Re-routing for Efficient Batch Decoding in MoE Models
Mixed-Of-Experts (MoE) アーキテクチャは、スパースアクティベーションを採用し、高密度の大規模言語モデル (LLM) に対しては高速かつ高精度なトレーニングおよび推論を実現します。しかし、本番サービング環境では、ハードウェア効率を最適化するためにバッチ推論が必要となり、それが不要な専門家のアクティベーションを招き、メモリー制限によるデコーディングステージを遅延させる要因となりま...
Original: arXiv:2602.07616v1 Announce Type: new Abstract: Mixture-of-Experts (MoE) architectures employ sparse activation to deliver faster training and inference with higher accuracy than dense LLMs. However,...
Dense Neural Networks are not Universal Approximators
arXiv:2602.07618v1 発表 タイプ:新 摘要:われわれは、密集型ニューラルネットワークの近似能力を調査した。一般化近似定理は、重み値の制限がない場合に、十分大きなアーキテクチャは任意の連続関数を近似できることを確立するが、われわれは密集型ニューラルネットワークがこのような普遍性を備えていないことを示した。わが議論は、弱相則と、前馈ネットワークをメッセージ伝達型グラフニューラルネット...
Original: arXiv:2602.07618v1 Announce Type: new Abstract: We investigate the approximation capabilities of dense neural networks. While universal approximation theorems establish that sufficiently large archit...
TASTE: 対石の操作を用いたタスク認識型の外れ値検出
TASTE: Task-Aware Out-of-Distribution Detection via Stein Operators
arXiv:2602.07640v1 公開タイプ: 新しい 要約:外れ値検出手法は、しばしば訓練入力分布からの偏離を検出するデータ中心のアプローチ(これがトレーニングされたモデルに与える影響を考慮していない場合がある)か、分類器の出力に依存するモデル中心のアプローチ(明示的なデータ幾何学の参照を含まない場合がある)であることが多い。当提案の TASTE(タスク認識型 対石の操作)は、対石と呼ばれる...
Original: arXiv:2602.07640v1 Announce Type: new Abstract: Out-of-distribution detection methods are often either data-centric, detecting deviations from the training input distribution irrespective of their ef...