3496 articles
黒箱モデルにおける主効果の推定に適用された累積集合 D-最良設計
Accumulated Aggregated D-Optimal Designs for Estimating Main Effects in Black-Box Models
arXiv:2510.08465v2 Announce Type: replace-cross 要旨:個々の入力変数が黒箱モデルの出力に与える影響を推定することは、可視性機械学習における中心的なタスクです。しかし、既存の方法は、2 つの主要な制約に苦しんでおり、それは、データ多様体が遠く離れた所での問い合わせ点を配置した場合に発生する分割外(OOD)評価への感受性、および実践において信頼性の低い効...
Original: arXiv:2510.08465v2 Announce Type: replace-cross Abstract: Estimating how individual input variables affect the output of a black-box model is a central task in explainable machine learning. However, ...
Transformers は一部のグラフでは接続性を学習できるが、他のグラフでは学習できない
Transformers Can Learn Connectivity in Some Graphs but Not Others
arXiv:2509.22343v2 Announce Type: replace-cross 要約:推論能力は、Transformer ベースの大規模言語モデル(LLMs)の応答的事実的正確性を保証するために不可欠であり、反復的関係に関する堅牢な推論は、因果推論など多くの設定において重要である。したがって、Transformer が反復的関係(例:A が B に起因し、B が C に起因する場合...
Original: arXiv:2509.22343v2 Announce Type: replace-cross Abstract: Reasoning capability is essential to ensure the factual correctness of the responses of transformer-based Large Language Models (LLMs), and r...
NISQ デバイスにおける動的回路の量子ビット再利用と Grover 最適化によるスケーラブルな量子強化学習
Scalable Quantum Reinforcement Learning on NISQ Devices with Dynamic-Circuit Qubit Reuse and Grover Optimization
arXiv:2509.16002v2 Announce Type: replace-cross 要約:本稿では、多段階量子マルコフ決定過程(QMDPs)における線形量子ビットスケーリングの壁を取り除く、スケーラブルかつリソース効率の高い量子強化学習フレームワークを提示します。提案されたフレームワークは、QMDP 記述、動的回路実行、および Grover ベースの振幅増幅を統合した統合的な量子ネイ...
Original: arXiv:2509.16002v2 Announce Type: replace-cross Abstract: A scalable and resource-efficient quantum reinforcement learning framework is presented that eliminates the linear qubit-scaling barrier in m...
MasconCube: 明示表現による高速かつ高精度な重力モデル化
MasconCube: Fast and Accurate Gravity Modeling with an Explicit Representation
非規則形状の小惑星の地質学は、重力場モデル化において根本的な課題を呈しており、特に深宇宙探査ミッションが小惑星や彗星を標的にするようになるにつけ、その重要性が増しています。従来のアプローチには重要な限界が存在します:球調和関数は通常、宇宙船が動作するブリユアン球体内で発散し、多角形モデルは不现实な均質な密度分布を仮定し、既存の機械学習手法(GeodesyNets や Physics-Informe...
Original: arXiv:2509.08607v3 Announce Type: replace-cross Abstract: The geodesy of irregularly shaped small bodies presents fundamental challenges for gravitational field modeling, particularly as deep space e...
ゲージ不変な確率的ニューラル場:安定性と有限幅効果
Gauge-covariant stochastic neural fields: Stability and finite-width effects
arXiv:2508.18948v2 Announce Type: replace-cross Abstract: We develop a gauge-covariant stochastic effective field theory for stability and finite-width effects in deep neural systems. The model uses ...
Original: arXiv:2508.18948v2 Announce Type: replace-cross Abstract: We develop a gauge-covariant stochastic effective field theory for stability and finite-width effects in deep neural systems. The model uses ...
プストトレーニングクランティゼされた大規模言語モデルのためのタスク階層型知識スケーリング法則
Task-Stratified Knowledge Scaling Laws for Post-Training Quantized Large Language Models
arXiv:2508.18609v4 Announce Type: replace-cross 要約:プストトレーニングクランティゼーション (PTQ) は、効率的な大規模言語モデル (LLM) デプロイメントにおける重要な戦略である。しかし、既存のスケーリング法則は主に一般的な性能に焦点を当てており、重要なきの細粒度ファクターや、クランティゼーションが異なる知識能力に及ぼす影響の違いを看過して...
Original: arXiv:2508.18609v4 Announce Type: replace-cross Abstract: Post-Training Quantization (PTQ) is a critical strategy for efficient Large Language Models (LLMs) deployment. However, existing scaling laws...
Robust な GenAI 本家システムを構築するための基礎設計原則とパターン
Foundational Design Principles and Patterns for Building Robust and Adaptive GenAI-Native Systems
arXiv:2508.15411v3 Announce Type: replace-cross Abstract: 生成 AI(GenAI)は、多様なアプリケーション領域にわたって変革的な技術としての能力を示しています。しかし、GenAI の予測不能性と低効率性のために、信頼性が高く効率性の高い GenAI 駆動システムの開発において、いくつかの主要な課題に直面しています。本論文は、パラダイムシフ...
Original: arXiv:2508.15411v3 Announce Type: replace-cross Abstract: Generative AI (GenAI) has emerged as a transformative technology, demonstrating remarkable capabilities across diverse application domains. H...
サブタスクパイプライン用最適 LLM 選択のための神経帯یتアルゴリズム
Neural Bandit Based Optimal LLM Selection for a Pipeline of Subtasks
arXiv:2508.09958v3 発表 タイプ:replace-cross 概要:大型言語モデル (LLM) が急速に普及する中、特定のクエリに対して、低コストでどのような LLM のセットが成功した回答を生むかを予測する必要性が高まっています。この問題は、LLM エージェントが解くべき「エージェント型」AI タスクの多様化に伴いさらに重要性を増します。そのようなタスクは、それぞれ特定のサブタ...
Original: arXiv:2508.09958v3 Announce Type: replace-cross Abstract: As large language models (LLMs) become increasingly popular, there is a growing need to predict which out of a set of LLMs will yield a succe...
ReasonRank: 強力な推理能力によるパスレートの昇進
ReasonRank: Empowering Passage Ranking with Strong Reasoning Ability
arXiv:2508.07050v3 Announce Type: replace-cross Abstract: Large Language Model (LLM) におけるリストライズなランク付けは、多くのパスレートのタスクで優れてるパフォーマンスを示した。Large Reasoning Models (LRM) の開発により、テスト時にステップバイステップの推理がリストライズなランク付けの...
Original: arXiv:2508.07050v3 Announce Type: replace-cross Abstract: Large Language Model (LLM) based listwise ranking has shown superior performance in many passage ranking tasks. With the development of Large...
Adaptive Multi-task Learning for Multi-sector Portfolio Optimization
arXiv:2507.16433v2 Announce Type: replace-cross Abstract: 多セクターポートフォリオ最適化において、多数の異なるクラスの資産を扱う場合、複数のセクター間で正確に情報を転移させ、モデル推定を向上させることは非常に重要であり、同時に挑戦的な課題です。ファクターモデリングの枠組みにおいて、我々は複数の対象セクターを跨ぐ主要な時間的サブ空間(ファク...
Original: arXiv:2507.16433v2 Announce Type: replace-cross Abstract: Accurate transfer of information across multiple sectors to enhance model estimation is both significant and challenging in multi-sector port...
数値解析を用いた動的系学習におけるアーティファクト
Artifacts of Numerical Integration in Learning Dynamical Systems
arXiv:2507.14491v4 Announce Type: replace-cross 要約:多くの応用において、有限個の時間点における解から動的系を学習する必要がある。この学習問題は、選択された関数クラスに対して最適化問題として表現されることが多い。しかし、最適化手順において、一般の動的システムからの予測データを評価する際、観測データとの不整合性を判断するために数値解析器が必要となる。本...
Original: arXiv:2507.14491v4 Announce Type: replace-cross Abstract: In many applications, one needs to learn a dynamical system from its solutions sampled at a finite number of time points. The learning proble...
マルチチェーン MDP におけるより高速な固定点法
Faster Fixed-Point Methods for Multichain MDPs
arXiv:2506.20910v2 Announce Type: replace-cross 要旨: 私たちは、平均報酬基準(a.k.a. マルチチェーン)の下で一般のマルコフ決定過程(MDPs)を解くために価値反復(VI)アルゴリズムを研究します。これは基本的でありながら理論的に挑戦的な設定です。すべての平均報酬問題に見られるベルマン演算子の非収束性と解の非一意性以及び、マルチチェーン設定にお...
Original: arXiv:2506.20910v2 Announce Type: replace-cross Abstract: We study value-iteration (VI) algorithms for solving general (a.k.a. multichain) Markov decision processes (MDPs) under the average-reward cr...
機械学習生成された代理報酬を持つマルチアームバンディット
Multi-Armed Bandits With Machine Learning-Generated Surrogate Rewards
arXiv:2506.16658v2 Announce Type: replace-cross 要約:マルチアームバンディット(MAB)は、不確実性下でのシークエンス・デシジョン・メイキングにおいて広く採用されている枠組みです。従来のバンディットアルゴリズムはオンラインデータのみを依存しており、これはアームがアクティブに引かれたオンラインフェーズに収集されるため、限られたデータである傾向にありま...
Original: arXiv:2506.16658v2 Announce Type: replace-cross Abstract: Multi-armed bandit (MAB) is a widely adopted framework for sequential decision-making under uncertainty. Traditional bandit algorithms rely s...
モデル内部探査: 現代の言語モデルにおける単語同定と屈折特徴の検索
Model Internal Sleuthing: Finding Lexical Identity and Inflectional Features in Modern Language Models
arXiv:2506.02132v5 Announce Type: replace-cross 摘要: 大規模なトランスフォーマー型言語モデルが現代的自然言語処理を支配しているにもかかわらず、彼らが言語情報をどのようにエンコードするかについての理解は、BERT や GPT-2 などの早期モデルに関する研究に主要に依存しています。BERT Base から Qwen2.5-7B までの 25 モデルに...
Original: arXiv:2506.02132v5 Announce Type: replace-cross Abstract: Large transformer-based language models dominate modern NLP, yet our understanding of how they encode linguistic information relies primarily...
CubeDAgger: 動的システム向けの効率的かつ低リスクなインタラクティブ模倣学習
CubeDAgger: Interactive Imitation Learning for Dynamic Systems with Efficient yet Low-risk Interaction
arXiv:2505.04897v2 発表タイプ:replace-cross 摘要:インタラクティブ模倣学習では、エキスパートからの段階的な監督によってエージェントの制御政策の強靭性を向上させる。最近のアルゴリズムの多くは、監督のタイミングを限定的に選択することでエキスパートの負担を軽減するために、エキスパートとエージェントの切り替えシステムを採用している。しかし、このアプローチは静的タスクには有...
Original: arXiv:2505.04897v2 Announce Type: replace-cross Abstract: Interactive imitation learning makes an agent's control policy robust by stepwise supervisions from an expert. The recent algorithms mostly e...
分散型量子ニューラルネットワークにおけるパラメータ数とローカルフェッチャーパッチ数が損失景観に及ぼす影響
The effect of the number of parameters and the number of local feature patches on loss landscapes in distributed quantum neural networks
arXiv:2504.19239v2 Announce Type: replace-cross 要約: 量子ニューラルネットワークは、古典コンピュータにとっては計算不可能であるが計算的に困難な課題を解決する可能性を秘めています。しかし、彼らの実用的な応用は、バーレンプレオと多数のローカル極小値で特徴付けられる複雑な損失景観から生じる著しい最適化課題によって妨げられています。これらの問題はパラメー...
Original: arXiv:2504.19239v2 Announce Type: replace-cross Abstract: Quantum neural networks hold promise for tackling computationally challenging tasks that are intractable for classical computers. However, th...
量子アダプティブ・セルフアテンションによる量子トランズフォーマーモデル向け最適化
Quantum Adaptive Self-Attention for Quantum Transformer Models
arXiv:2504.05336v3 Announce Type: replace-cross 摘要:量子計算を深層学習アーキテクチャに統合することは有望だが未解明な課題です。量子層が実際にどのように機能し、どの程度の量子計算が必要なのか。本研究は、量子アダプティブ・セルフアテンション(QASA)というハイブリッドトランズフォーマーを通じて両方の疑問に答えます。QASA はエンコーダーの 1 レベ...
Original: arXiv:2504.05336v3 Announce Type: replace-cross Abstract: Integrating quantum computing into deep learning architectures is a promising but poorly understood endeavor: when does a quantum layer actua...
The Optical and Infrared Are Connected
arXiv:2503.03816v2 Announce Type: replace-cross Abstract: 銀河は、異なるスペクトル特徴を有する分離可能な成分の複合体としてしばしばモデル化され、異なる波長範囲は弱い相関のみであることを示唆する。しかしそうではない。物理過程間の微妙な相関を活用したデータ駆動モデルを提示します。このモデルは、SDSS 的光スペクトルの神経網要約から、正確に赤外...
Original: arXiv:2503.03816v2 Announce Type: replace-cross Abstract: Galaxies are often modelled as composites of separable components with distinct spectral signatures, implying that different wavelength range...
深学習に基づく音声補正のためのthroatおよびアコースティック音声のペア付きデータセット
Throat and acoustic paired speech dataset for deep learning-based speech enhancement
arXiv:2502.11478v3 発表タイプ:置き換えクロス 概要:工場、地下鉄、賑やかな道路のような高ノイズ環境において、明確な音声の捕捉は困難です。throatマイクには固有のノイズ抑制機能があるため、解決策となり得ますが、音波が皮膚および組織を通過する際に高周波情報が減衰し、語りの明瞭性が低下します。最近の深学習アプローチは、throatマイク記録の補正において有望な成果を示しています...
Original: arXiv:2502.11478v3 Announce Type: replace-cross Abstract: In high-noise environments such as factories, subways, and busy streets, capturing clear speech is challenging. Throat microphones can offer ...
BatchLLM: グローバルプレフィックス共有と Throughput 指向型トークンバッチ化による大規模バッチ LLM 推論の最適化
BatchLLM: Optimizing Large Batched LLM Inference with Global Prefix Sharing and Throughput-oriented Token Batching
arXiv:2412.03594v3 Announce Type: replace-cross 要約: 大規模言語モデル(LLM)は、現在工業界の広範な情報処理・管理タスクにおいてますます重要な役割を果たしています。これらのタスクの多くは、大規模バッチ、あるいはオフラインで実行され、その性能指標は Throughput です。これらのタスクは、異なるプロンプト入力において共通のプレフィックスを共...
Original: arXiv:2412.03594v3 Announce Type: replace-cross Abstract: Large language models (LLMs) increasingly play an important role in a wide range of information processing and management tasks in industry. ...