3496 articles

arxiv_cs_lg 2026/2/10

マルチモーダル大規模言語モデルを用いた効率的なテーブル抽出と理解

Efficient Table Retrieval and Understanding with Multimodal Large Language Models

arXiv:2602.07642v1 Announce Type: cross 要旨：表形式のデータは、金融レポート、手書き記録、文書スキャンなど、多岐にわたるリアルワールドシナリオにおいて画像形式で頻繁に記録されています。これらの視覚表現は、構造的かつ視覚的な複雑さを両方備えているため、機械による理解においてユニークな課題を呈します。最近のマルチモーダル大規模言語モデル（MLLMs）の進歩は表理...

Original: arXiv:2602.07642v1 Announce Type: cross Abstract: Tabular data is frequently captured in image form across a wide range of real-world scenarios such as financial reports, handwritten records, and doc...

arxiv_cs_lg 2026/2/10

コード世界モデルのデバッグ

Debugging code world models

arXiv:2602.07672v1 発表タイプ: クロス要旨: コード世界モデル (CWM) は、実行されたすべてのコマンド後に明示的な実行時状態を予測することでプログラム実行をシミュレートするために訓練された言語モデルです。この実行に基づく世界モデルは、モデル内の内部検証を可能にし、自然言語のチェーンオブサンツ思考の代案となるものです。ただし、CWM のエラーの源泉や限界は依然としてよく理解...

Original: arXiv:2602.07672v1 Announce Type: cross Abstract: Code World Models (CWMs) are language models trained to simulate program execution by predicting explicit runtime state after every executed command....

arxiv_cs_lg 2026/2/10

Metric 空間における生成（Generation）

On Generation in Metric Spaces

arXiv:2602.07710v1 Announce Type: cross Abstract: 我々は，分離可能な距離空間における生成（generation）の研究を行う。Kleinberg と Mullainathan（2024）の言語生成枠組みを，可算な領域を超え， novelty を距離の分離（metric separation）を通じて定義し，敵対的生成者（adversary）および...

Original: arXiv:2602.07710v1 Announce Type: cross Abstract: We study generation in separable metric instance spaces. We extend the language generation framework from Kleinberg and Mullainathan [2024] beyond co...

arxiv_cs_lg 2026/2/10

BFTS: Bayes アドデティブ回帰木を用いた Thompson Sampling

BFTS: Thompson Sampling with Bayesian Additive Regression Trees

arXiv:2602.07767v1 発表タイプ：クロス要約：文脈バンドットは、複雑で非線形なユーザー行動に適応した意思決定を必要とするパーソナライズされたモバイルヘルス介入の核となる技術です。Thompson Sampling (TS) はこれらの問題では好まれた戦略ですが、その性能は背後に存在する報酬モデルの品質に依存しています。標準的な線形モデルはバイアスが強く、ニューラルネットワークア...

Original: arXiv:2602.07767v1 Announce Type: cross Abstract: Contextual bandits are a core technology for personalized mobile health interventions, where decision-making requires adapting to complex, non-linear...

arxiv_cs_lg 2026/2/10

TodoEvolve: 自律的エージェントпланиリングシステムを設計・構築する学習

TodoEvolve: Learning to Architect Agent Planning Systems

arXiv:2602.07839v1 Announce Type: cross 要約: パーティショニングは、現代のエージェントシステムが複雑かつ長期的なタスクをナビゲートする上で中心的な能力へと成長しました。しかし、既存のアプローチは、オープンエンドの課題の構造的な多様性に適応する柔軟性を欠く固定された、手動で作成されたパーティショニング構造に主に依存しています。この限界に対処するため、私たち...

Original: arXiv:2602.07839v1 Announce Type: cross Abstract: Planning has become a central capability for contemporary agent systems in navigating complex, long-horizon tasks, yet existing approaches predominan...

arxiv_cs_lg 2026/2/10

MemFly: Information Bottleneck によるオン・ザ・フライメモリ最適化

MemFly: On-the-Fly Memory Optimization via Information Bottleneck

arXiv:2602.07885v1 Announce Type: cross 要約：長期記憶は、言語モデルエージェントが歴史的相互作用を通じて複雑なタスクに取り組むことを可能にしますが、既存のフレームワークでは、不要な情報を効率的に圧縮し、ダウンストリームのタスクに対して正確な検索を維持するという基本的なジレンマに直面しています。このギャップを埋めるために、MemFly という、情報ボトルネック...

Original: arXiv:2602.07885v1 Announce Type: cross Abstract: Long-term memory enables large language model agents to tackle complex tasks through historical interactions. However, existing frameworks encounter ...

arxiv_cs_lg 2026/2/10

SparseEval: 大規模言語モデルに対するスパース最適化による効率的な評価

SparseEval: Efficient Evaluation of Large Language Models by Sparse Optimization

arXiv:2602.07909v1 発表形式：クロス摘要：大規模言語モデル（LLM）のスケールアップが進むにつれ、各種ダウンストリームタスクにおける性能は大幅に改善されています。しかし、大数のベンチマークサンプルへの推論を実行することが高コストであるため、その能力の評価はますます高価になっています。本稿では、モデル - アイテム性能行列の疎性を示し、代表アイテムをアンカー（錨）として選択可能...

Original: arXiv:2602.07909v1 Announce Type: cross Abstract: As large language models (LLMs) continue to scale up, their performance on various downstream tasks has significantly improved. However, evaluating t...

arxiv_cs_lg 2026/2/10

CausalArmor: 因果歸因に基づく効率的な間接プロンプト注入防護

CausalArmor: Efficient Indirect Prompt Injection Guardrails via Causal Attribution

arXiv:2602.07918v1 Announce Type: cross 摘要：トールコール機能を備えた AI エージェントは、間接プロンプト注入 (IPI) 攻撃にさらされやすい。この攻撃シナリオでは、信頼できないコンテンツ内に隠された悪意のあるコマンドが、エージェントに承認されていない行動を実行させるよう誘導する。既存の防御手段は攻撃成功率を低下させるものの、過剰防御のジレンマに直面し...

Original: arXiv:2602.07918v1 Announce Type: cross Abstract: AI agents equipped with tool-calling capabilities are susceptible to Indirect Prompt Injection (IPI) attacks. In this attack scenario, malicious comm...

arxiv_cs_lg 2026/2/10

Learning-guided Kolmogorov-Arnold 展開による線形を超えた前進・逆 PDE 解法

Learning-guided Kansa collocation for forward and inverse PDEs beyond linearity

arXiv:2602.07970v1 Announce Type: cross 要旨：偏微分方程式は物理的、生物的、および図式的現象の記述において高度な精度を備えています。しかし、数値手法は次元の呪い、高計算コスト、および領域固有の離散化といった課題に直面しています。本稿では、さまざまな偏微分方程式解法の長所と短所を検討し、それらを応用問題（前進解法、逆問題、方程式発見）に応用的に適用するのを目的...

Original: arXiv:2602.07970v1 Announce Type: cross Abstract: Partial Differential Equations are precise in modelling the physical, biological and graphical phenomena. However, the numerical methods suffer from ...

arxiv_cs_lg 2026/2/10

動画レコメンデーションにおける慣れバイアスの軽減学習

Learning to Alleviate Familiarity Bias in Video Recommendation

arXiv:2602.07987v1 Announce Type: cross 要約: 現代の動画レコメンデーションシステムは、ユーザーエンゲージメントとプラットフォーム目標の最適化を目指していますが、行動バイアスによって引き起こされる構造的な露出偏りが生じる問題があります。本研究では、ランキング後の段階に焦点を当て、レコメンデーション出力における慣れバイアスを緩和するために設計された軽量かつモ...

Original: arXiv:2602.07987v1 Announce Type: cross Abstract: Modern video recommendation systems aim to optimize user engagement and platform objectives, yet often face structural exposure imbalances caused by ...

arxiv_cs_lg 2026/2/10

Softmax-Gated Multinomial-Logistic Mixture-of-Experts モデルにおける高速モデル選択と安定な最適化

Fast Model Selection and Stable Optimization for Softmax-Gated Multinomial-Logistic Mixture of Experts Models

arXiv:2602.07997v1 Announce Type: cross 要旨：専門予測子を学習されたゲートで結合する Mixture-of-Experts (MoE) アーキテクチャは回帰および分類の両方で効果的ですが、softmax Multinomial-Logistic ゲートを用いた分類において、安定な最大尤推論および原理的なモデル選択のための厳密な保証はまだ限られています。私たち...

Original: arXiv:2602.07997v1 Announce Type: cross Abstract: Mixture-of-Experts (MoE) architectures combine specialized predictors through a learned gate and are effective across regression and classification, ...

arxiv_cs_lg 2026/2/10

新しい測度の転換不等式によるより厳しい情報論的な一般化誤りの境界

Tighter Information-Theoretic Generalization Bounds via a Novel Class of Change of Measure Inequalities

arXiv:2602.07999v1 Announce Type: cross 摘要：本稿では、データ処理不等式に基づく統一枠組みを通じて、新たな測度の転換不等式のクラスを提案します。この枠組みは驚くほど単純であるにもかかわらず、より厳しい不等式を生み出す十分な力を備えています。我々は、Kullback-Leibler 発散とχ^2-発散を特殊ケースとする f-発散を含む広範な情報量の一連、Rén...

Original: arXiv:2602.07999v1 Announce Type: cross Abstract: In this paper, we propose a novel class of change of measure inequalities via a unified framework based on the data processing inequality for $f$-div...

arxiv_cs_lg 2026/2/10

Maximum Discrimination を用いたグラフに基づく半教師済み学習

Graph-based Semi-Supervised Learning via Maximum Discrimination

arXiv:2602.08042v1 Announce Type: cross 要約: 半教師済み学習（SSL）は、ラベル付けされたデータが豊富にあるが、ラベル付けされていないデータが豊富である状況で、高精度なモデルをトレーニングするという重要な課題に対処します。グラフベースの SSL（GSSL）は、グラフ表現を通じてデータ構造を捉えることで広く採用されたフレームワークとして台頭しました。ラベル伝...

Original: arXiv:2602.08042v1 Announce Type: cross Abstract: Semi-supervised learning (SSL) addresses the critical challenge of training accurate models when labeled data is scarce but unlabeled data is abundan...

arxiv_cs_lg 2026/2/10

CAPSARII アプローチによるサイバー安全なウェアラブルおよび超低電力ネットワーク型センサー：兵士の健康監視のために

The CAPSARII Approach to Cyber-Secure Wearable, Ultra-Low-Power Networked Sensors for Soldier Health Monitoring

arXiv:2602.08080v1 Announce Type: cross 要旨：欧州防衛機関の改訂版能力開発計画（CDP）は、兵士の防護性能を向上させることで地上戦闘能力を強化することを選択優先事項として定めています。CAPSARII プロジェクトは、兵士の生理的および心理的状態を監視する革新的なウェアラブルシステムと、戦地Things（IoBT）フレームワークを提案しています。このシステム...

Original: arXiv:2602.08080v1 Announce Type: cross Abstract: The European Defence Agency's revised Capability Development Plan (CDP) identifies as a priority improving ground combat capabilities by enhancing so...

arxiv_cs_lg 2026/2/10

GAAVI: 条件平均関数に対するグローバル漸近時任意の妥当推論

GAAVI: Global Asymptotic Anytime Valid Inference for the Conditional Mean Function

arXiv:2602.08096v1 Announce Type: cross 摘要：条件平均関数（CMF）に対する推論は、適応実験、最適治療割り当て、およびアルゴリズム的公平性監査など、多岐にわたるタスクの中心に位置しています。本研究では、実験者が最小サンプルサイズを超えた実験の任意時点において高い確信度で意思決定を行うことを可能にする、CMF のグローバル Null 仮説（例：すべての条件平均...

Original: arXiv:2602.08096v1 Announce Type: cross Abstract: Inference on the conditional mean function (CMF) is central to tasks from adaptive experimentation to optimal treatment assignment and algorithmic fa...

arxiv_cs_lg 2026/2/10

マルチエージェント強化学習システムにおける解釈可能な失敗解析

Interpretable Failure Analysis in Multi-Agent Reinforcement Learning Systems

arXiv:2602.08104v1 発表タイプ: 横断要約：マルチエージェント強化学習（MARL）は、安全性が極めて高い分野にますます導入されていますが、解釈可能な失敗検出および帰属の手法は依然として発展途上です。私々は、解釈可能な診断を提供する 2 つ段階の勾配に基づくフレームワークを導入し、3 つの重要な失敗解析タスクに対応しました：(1) 真正な初期失敗源（Patient-0）を検出する...

Original: arXiv:2602.08104v1 Announce Type: cross Abstract: Multi-Agent Reinforcement Learning (MARL) is increasingly deployed in safety-critical domains, yet methods for interpretable failure detection and at...

arxiv_cs_lg 2026/2/10

大規模言語モデルによる消費者製品推奨におけるジェンダーと人種バイアス

Gender and Race Bias in Consumer Product Recommendations by Large Language Models

arXiv:2602.08124v1 Announce Type: cross 要約: 大規模言語モデル（LLM）は消費者製品の推薦生成においてますます広く採用されているものの、それらが埋め込むあるいは増幅するジェンダーおよび人種バイアスの可能性についてはまだ十分に研究されていません。本論文は、LLM 生成の推薦におけるこれらのバイアスを調査する初号目の試みです。私たちはプロンプトエンジニアリング...

Original: arXiv:2602.08124v1 Announce Type: cross Abstract: Large Language Models are increasingly employed in generating consumer product recommendations, yet their potential for embedding and amplifying gend...

arxiv_cs_lg 2026/2/10

マルチポート散乱体用荷重予測のための「クラスタリングから予測へ」枠組みの調整

Adjustment of Cluster-Then-Predict Framework for Multiport Scatterer Load Prediction

arXiv:2602.08129v1 Announce Type: cross 要約：マルチポート散乱体における相互依存する荷重値の予測は、高次元性およびインピーダンスと散乱能力間の複雑な依存関係により困難ですが、これは通信および測定システムの設計において極めて重要です。本稿では、マルチポート散乱体の複数の荷重値予測タスクのために、2 段階の「クラスタリングから予測へ」枠組みを提案します。提案した...

Original: arXiv:2602.08129v1 Announce Type: cross Abstract: Predicting interdependent load values in multiport scatterers is challenging due to high dimensionality and complex dependence between impedance and ...

arxiv_cs_lg 2026/2/10

ダミーコード注入による IoT マルウェア検出の回避

Evasion of IoT Malware Detection via Dummy Code Injection

arXiv:2602.08170v1 Announce Type: cross Abstract: 物聯網 (IoT) は、世界中に数十億のデバイスを連結することで接続性を革命化しました。しかし、この急速な拡張は同時に深刻なセキュリティ脆弱性を導入し、Mirai ボットネットなどのマルウェアに IoT デバイスが魅力的な標的となったのを助长了。最近、デバイスの消費電力パターンに基づくマルウェア活...

Original: arXiv:2602.08170v1 Announce Type: cross Abstract: The Internet of Things (IoT) has revolutionized connectivity by linking billions of devices worldwide. However, this rapid expansion has also introdu...

arxiv_cs_lg 2026/2/10

文脈付きマルチレイヤー確率ブロックモデルにおけるコミュニティ検出の根本的な限界

Fundamental Limits of Community Detection in Contextual Multi-Layer Stochastic Block Models

arXiv:2602.08173v1 告知タイプ: cross 要約：高次元共変行列と $L$ つの疎ネットワークの同時観察からコミュニティ検出の問題を検討する。これらは、$n$ 人の被験者の潜在コミュニティラベルに関する noisy な部分的な情報を符号化する。ネットワークの平均度数が一定である漸近的な制約において、特徴量の数 $p$ が $n$ に比例して増加する場合、被験者ラベルを検出・推定...

Original: arXiv:2602.08173v1 Announce Type: cross Abstract: We consider the problem of community detection from the joint observation of a high-dimensional covariate matrix and $L$ sparse networks, all encodin...