3496 articles
脆い思考:大規模言語モデルが連鎖思考の妨害をどのように扱うか
Fragile Thoughts: How Large Language Models Handle Chain-of-Thought Perturbations
arXiv:2603.03332v3 Announce Type: replace-cross 要旨: 思考連鎖(Chain-of-Thought、CoT)プロンプティングは、大規模言語モデル(LLM)からの推理を引き出すための基礎的な手法として台頭しましたが、このアプローチが中間の推理ステップにおける腐敗に対してどれだけ頑健なのかは、まだ十分に理解されていません。本論文では、LLM の頑健性を...
Original: arXiv:2603.03332v3 Announce Type: replace-cross Abstract: Chain-of-Thought (CoT) prompting has emerged as a foundational technique for eliciting reasoning from Large Language Models (LLMs), yet the r...
スケーラブルな事後不確実性の推定に基づく柔軟な密度ベースのクラスタリング
Scalable Posterior Uncertainty for Flexible Density-Based Clustering
arXiv:2603.03188v2 Announce Type: replace-cross 要約: 私たちは、マルチングアル後の分布と密度ベースのクラスタリングを組み合わせた不確実性の量化のための新しい枠組みを導入します。古典的なモデルベースのアプローチでは、ミックスモデルの潜在レベルでクラスタを定義されていますが、私たちはパラメトリックな形式を仮定せずに、密度生成関数としての明示的な関数論と...
Original: arXiv:2603.03188v2 Announce Type: replace-cross Abstract: We introduce a novel framework for uncertainty quantification in clustering that combines martingale posterior distributions with density-bas...
代理の情報論的コスト:分散型強化学習における相互作用効率の上限測定量
The Informational Cost of Agency: A Bounded Measure of Interaction Efficiency for Deployed Reinforcement Learning
arXiv:2603.01283v2 Announce Type: replace-cross 概要:分散型 RL エージェントは、観測値、動作、および結果の間の一貫性な結合を維持することで、信頼性の高いパフォーマンスを発揮する閉ループシステムで動作します。現在の監視アプローチは、反応的に設計された報酬とタスク指標に依存しており、パフォーマンスの崩壊が前駆する構造的分離を無視しています。我々は、部...
Original: arXiv:2603.01283v2 Announce Type: replace-cross Abstract: Deployed RL agents operate in closed-loop systems where reliable performance depends on maintaining coherent coupling between observations, a...
有限要素法と極端学習ネットワークを用いたパラメータ逆問題の解法
Solving Inverse Parametrized Problems via Finite Elements and Extreme Learning Networks
arXiv:2602.14757v2 Announce Type: replace-cross 要旨:当稿では、制御、逆問題、不確定性定量化において生じるパラメータ依存偏微分方程式に対して、パラメータ変数に関するソボレー空間の滑らかさを根拠とした代数収束率を持つ古典的な補間スキームを用いたモデル化枠組みを開発する。解は物理領域を離散化するために有限要素法を用い、有限次元パラメータに関する依存性は別...
Original: arXiv:2602.14757v2 Announce Type: replace-cross Abstract: We develop an interpolation-based modeling framework for parameter-dependent partial differential equations arising in control, inverse probl...
多項式ニューラルネットワークの頑健性検証:計数幾何学の視点
Robustness Verification of Polynomial Neural Networks
論文:arXiv:2602.06105v2 Announce Type: replace-cross 要約: 私たちは、計数代数的幾何学を通じてニューラルネットワークの頑健性検証を研究する。多項式ニューラルネットワークにおいて、頑健半径の証明(certifying)は、代数決定境界への距離を計算することに等しい。我々は、この問題の複雑性の内在的指標であるユークリッド距離(ED)次数を用い、関連す...
Original: arXiv:2602.06105v2 Announce Type: replace-cross Abstract: We study robustness verification of neural networks via metric algebraic geometry. For polynomial neural networks, certifying a robustness ra...
医療試験のワークフローにおける精度と効率の向上を目指した AI 支援プロトコル情報抽出
AI-assisted Protocol Information Extraction For Improved Accuracy and Efficiency in Clinical Trial Workflows
arXiv:2602.00052v2 Announce Type: replace-cross 要旨:臨床試験プロトコルの複雑化、修正、および知識管理に関する課題は、試験チームに大きな負担をきたしています。プロトコル内容を標準形式に整理することは、効率の向上、ドキュメント品質の支援、およびコンプライアンスの強化に寄与する可能性があります。本稿では、検索拡張生成(RAG)技術を備えた生成型大規模言語...
Original: arXiv:2602.00052v2 Announce Type: replace-cross Abstract: Increasing clinical trial protocol complexity, amendments, and challenges around knowledge management create significant burden for trial tea...
AscendKernelGen: 神経処理ユニットのための LLM ベースの kernels 生成に関する体系的な研究
AscendKernelGen: A Systematic Study of LLM-Based Kernel Generation for Neural Processing Units
arXiv:2601.07160v2 Announce Type: replace-cross Abstract: 計算効率への恒常的な需要を満たすために、神経処理ユニット(NPU)は現代の AI インフラストラクチャにおいて不可欠 geworden しました。しかし、それらの最大限のポテンシャルをUnlock するには、ベンダー固有のドメイン特定言語(DSL)を使用して高性能な計算 kernel...
Original: arXiv:2601.07160v2 Announce Type: replace-cross Abstract: To meet the ever-increasing demand for computational efficiency, Neural Processing Units (NPUs) have become critical in modern AI infrastruct...
CLewR:機械翻訳の優先度学習のための再試行付きカリキュラム学習
CLewR: Curriculum Learning with Restarts for Machine Translation Preference Learning
arXiv:2601.05858v2 Announce Type: replace-cross 要約:大規模言語モデル(LLM)は、ゼロショット複数言語機械翻訳(MT)において競争力のある性能を示しています。いくつかの従後研究は、優先度最適化を通じて MT の性能をさらに向上させていますが、それらは訓練中にデータサンプルの提示順序という重要な側面がまだ十分に調査されていないという課題を残しています...
Original: arXiv:2601.05858v2 Announce Type: replace-cross Abstract: Large language models (LLMs) have demonstrated competitive performance in zero-shot multilingual machine translation (MT). Some follow-up wor...
EnvScaler: LLM エージェントのためのプログラム合成に基づくスケーラブルなツールインタラクション環境の構築
EnvScaler: Scaling Tool-Interactive Environments for LLM Agent via Programmatic Synthesis
arXiv:2601.05808v2 発表タイプ:replace-cross 要約:大規模言語モデル(LLM)は、さまざまな実世界環境でエージェントとして動作するよう訓練されると予想されていますが、このプロセスには豊かで多様なツールインタラクションサンドボックスが不可欠です。しかし、実システムのアクセスは頻繁に制限されており、LLM シミュレーション環境は幻覚と矛盾に悩まされ、手動で構築されたサン...
Original: arXiv:2601.05808v2 Announce Type: replace-cross Abstract: Large language models (LLMs) are expected to be trained to act as agents in various real-world environments, but this process relies on rich ...
Disco-RAG:会話構造に敏感な検索拡張生成
Disco-RAG: Discourse-Aware Retrieval-Augmented Generation
arXiv:2601.04377v5 Announce Type: replace-cross 要旨:検索拡張生成(RAG)は、知識密度の高いタスクにおける大規模言語モデル(LLM)のパフォーマンス向上において重要な手段として登場しました。しかし、既存の多くの RAG ストラテジーは、検索された段落をフラットかつ構造化されていない方法で扱い、モデルが構造の手がかりを捉えることができず、分散した証...
Original: arXiv:2601.04377v5 Announce Type: replace-cross Abstract: Retrieval-Augmented Generation (RAG) has emerged as an important means of enhancing the performance of large language models (LLMs) in knowle...
汎用的機械学習原子間ポテンシャルの潜在特異性の比較
Comparing the latent features of universal machine-learning interatomic potentials
arXiv:2512.05717v3 Announce Type: replace-cross 摘要:近年、広い化学構造と組成の範囲で地上状態のポテンシャルエネルギー表面を十分に精度よく近似できる「汎用」な機械学習原子間ポテンシャル(uMLIP)が開発されました。これらのモデルはアーキテクチャや使用datasetが異なりますが、膨大な化学情報を記述可能な潜在特異性に圧縮する能力を共有しています。こ...
Original: arXiv:2512.05717v3 Announce Type: replace-cross Abstract: The past few years have seen the development of ``universal'' machine-learning interatomic potentials (uMLIPs) capable of approximating the g...
プラズマにおけるモーメント閉鎖式の機械学習へのアプローチ: 回顧
The Machine Learning Approach to Moment Closure Relations for Plasma: A Review
arXiv:2511.22486v2 Announce Type: replace-cross 要約:プラズマの大規模・全域シミュレーションを求められていることは、宇宙プラズマおよび実験室プラズマ物理学において継続的な課題である。流体モデルに基づくあらゆるシミュレーションは、高次プラズマモーメントのための閉鎖式を内在的に必要とする。このレビューでは、プラズマ流体モデル内に動力学現象を捉える能力を備...
Original: arXiv:2511.22486v2 Announce Type: replace-cross Abstract: The requirement for large-scale global simulations of plasma is an ongoing challenge in both space and laboratory plasma physics. Any simulat...
Spira: 立方体データ構造特性を活用した点雲ネットワークにおける効率的なスパース畳み込み
Spira: Exploiting Voxel Data Structural Properties for Efficient Sparse Convolution in Point Cloud Networks
論文: arXiv:2511.20834v2 告知タイプ: replace-cross 要約:スパース畳み込み(SpC)は、自動運転および拡張/仮想リアリティで広く利用されている 3D ポイントクラウドネットワークを牽引しています。SpC は、入力の立方体座標と出力座標、および重みオフセット間のマッピングを保存するカーネルマップを構築し、それを使用して出力座標のための特性ベクトルを計算します。我...
Original: arXiv:2511.20834v2 Announce Type: replace-cross Abstract: Sparse Convolution (SpC) powers 3D point cloud networks widely used in autonomous driving and augmented/virtual reality. SpC builds a kernel ...
行間の読み取り:単一方向会話問題
Reading Between the Lines: The One-Sided Conversation Problem
arXiv:2511.03056v2 Announce Type: replace-cross 要旨:対話型 AI は、電話診療、コールセンター、スマートグラスといった一部の現実世界の環境において、対話の一方のみが記録されているという制約に直面しています。我々はこれを単一方向会話問題(1SC)として形式化し、対話の一方を推論して学習することを定義しました。我々は 2 つのタスクを調査した:(1)リ...
Original: arXiv:2511.03056v2 Announce Type: replace-cross Abstract: Conversational AI is constrained in many real-world settings where only one side of a dialogue can be recorded, such as telemedicine, call ce...
エージェント型 AI 実行の理解・分析・最適化への道:CPU 中心の視点から
Towards Understanding, Analyzing, and Optimizing Agentic AI Execution: A CPU-Centric Perspective
arXiv:2511.00739v3 Announce Type: replace-cross Abstract: エージェント型 AI サービングは、単一の LLM ベースの推論を、計画・ツール呼び出し・推論実行・即座に適応可能な自律問題解決者へ転換します。多様なタスク実行の要件により、そのようなサーバーは、エージェント型機能の責任の大部分を負う外部ツールが CPU 上で実行されるか、または ...
Original: arXiv:2511.00739v3 Announce Type: replace-cross Abstract: Agentic AI serving converts monolithic LLM-based inference to autonomous problem-solvers that can plan, call tools, perform reasoning, and ad...
PULSE: 豊富な情報から実行可能なセンサーへの特権知識転移のための体感型マルチセンサー学習
PULSE: Privileged Knowledge Transfer from Rich to Deployable Sensors for Embodied Multi-Sensory Learning
arXiv:2510.24058v3 Announce Type: replace-cross 要約: wearable 体センサーネットワークから器械化されたロボットプラットフォームまで、体感型知能のためのマルチセンサーシステムは、センサー非対称性の問題に直面しています。実験データ収集時に入手可能な最も情報量が多いモードは、コスト、脆弱性、または物理的操作への干渉のために、実運用時に欠如してい...
Original: arXiv:2510.24058v3 Announce Type: replace-cross Abstract: Multi-sensory systems for embodied intelligence, from wearable body-sensor networks to instrumented robotic platforms, routinely face a senso...
OjaKV: コンテキストに意識したオンラインで低ランクな KV Cache 圧縮
OjaKV: Context-Aware Online Low-Rank KV Cache Compression
arXiv:2509.21623v2 Announce Type: replace-cross Abstract: 大規模言語モデルの長文コンテキスト対応は、自己回帰生成に必要不可欠なキー値 (KV) Cache による重要なメモリボトルネックに制約されています。このボトルネックは重大です;例えば、Llama-3.1-8B モデルが 32K トークンのプロンプトをバッチサイズ 4 で処理する場合...
Original: arXiv:2509.21623v2 Announce Type: replace-cross Abstract: The expanding long-context capabilities of large language models are constrained by a significant memory bottleneck: the key-value (KV) cache...
TriagerX: 内容および相互作用に基づくランキングを備えたバグトリアージタスクのための Dual Transformers
TriagerX: Dual Transformers for Bug Triaging Tasks with Content and Interaction Based Rankings
arXiv:2508.16860v2 公告タイプ:代替 要約:事前学習済み言語モデル(PLM)は、トランスフォーマーベースのアーキテクチャであり、バグトリアージタスクに使用できます。PLM は、統計的特徴(例:TF-IDF、Bag of Words)に依存する従来の機械学習(ML)モデルよりも、トークンの意味をよりよく捉えられます。ただし、PLM はバグレポート内の関連性が低いトークンにまだ注目...
Original: arXiv:2508.16860v2 Announce Type: replace-cross Abstract: Pretrained Language Models or PLMs are transformer-based architectures that can be used in bug triaging tasks. PLMs can better capture token ...
長期音声バイオマーカーを用いたパーキンソン病の進行予測:統計的および神経混合効果モデルの比較研究
Modeling Parkinson's Disease Progression Using Longitudinal Voice Biomarkers: A Comparative Study of Statistical and Neural Mixed-Effects Models
arXiv:2507.20058v3 Announce Type: replace-cross Abstract: パーキンソン病(PD)の進行予測は個別化治療のために不可欠であり、音声バイオマーカーはテレモニタリングを通じて症状の重症度を追跡するための有望な非侵襲的アプローチを提供しています。しかし、この縦軸データ解析は、固有の被験者内相関、臨床試験で典型的なサンプルサイズの小ささ、および複雑...
Original: arXiv:2507.20058v3 Announce Type: replace-cross Abstract: Predicting Parkinson's Disease (PD) progression is crucial for personalized treatment, and voice biomarkers offer a promising non-invasive me...
ランダム化アルゴリズムを用いた順次回帰学習
Sequential Regression Learning with Randomized Algorithms
arXiv:2507.03759v2 発表タイプ: replace-cross 要旨:本稿は、時依存構造を有する動的データに適した「ランダム SINDy」という順次機械学習アルゴリズムを示します。本アルゴリズムは確率的アプローチを採用し、機能的解析の数学理論に基づきその PAC 学習特性が厳密に証明されています。予測者は学習された確率分布に基づき動的に予測を行い、勾配降下法と近傍アルゴリズムを通じ...
Original: arXiv:2507.03759v2 Announce Type: replace-cross Abstract: This paper presents ``randomized SINDy", a sequential machine learning algorithm designed for dynamic data that has a time-dependent structur...