2031 articles
Open-H-Embodiment: ファウンデーション・モデルを医療ロボット分野に統合するための大規模データセットの導入
Open-H-Embodiment: A Large-Scale Dataset for Enabling Foundation Models in Medical Robotics
arXiv:2604.21017v1 Announce Type: cross 摘要 自律医療ロボットは、患者のアウトカムを向上させ、提供者の負担を軽減し、医療アクセスを民主化し、人間を超越する正確性を可能にする有望な存在である。しかし、自律医療ロボット技術は、既存の医療ロボットデータセットが小さく、単一エンボディメントに限定され、かつオープンに共有されていないという根本的なデータ問題により制限...
Original: arXiv:2604.21017v1 Announce Type: cross Abstract: Autonomous medical robots hold promise to improve patient outcomes, reduce provider workload, democratize access to care, and enable superhuman preci...
SGD の安定性の限界:非決定論的な鋭さギャップ
SGD at the Edge of Stability: The Stochastic Sharpness Gap
arXiv:2604.21016v1 Announce Type: cross Abstract: フルバッチ勾配降降(GD)とステップサイズ $\eta$ を用いてニューラルネットワークを訓練する際、ヘッセ行列の最大固有値(すなわち鋭さ $S(\boldsymbol{\theta})$)は $2/\eta$ まで上昇し、その値で安定します。この現象は「安定性の限界(Edge of Stabili...
Original: arXiv:2604.21016v1 Announce Type: cross Abstract: When training neural networks with full-batch gradient descent (GD) and step size $\eta$, the largest eigenvalue of the Hessian -- the sharpness $S(\...
MCP の破壊を招く関数ハッキング攻撃:関数呼び出しおよびエージェントモデルに対する新しい脅威
Breaking MCP with Function Hijacking Attacks: Novel Threats for Function Calling and Agentic Models
arXiv:2604.20994v1 発表種別:横断 要旨:エージェント AI の発展により、外部関数を呼び出して AI ドライブシステムの機能を拡張するように設計された関数呼び出し型大規模言語モデル(LLM)への関心が高まりました。インジェクションおよび Jailbreaking 攻撃は、LLM のユーザープロンプト操作に対する脆弱性を示すために広く研究されています。エージェントモデルの拡張され...
Original: arXiv:2604.20994v1 Announce Type: cross Abstract: The growth of agentic AI has drawn significant attention to function calling Large Language Models (LLMs), which are designed to extend the capabilit...
Differentially Private Model Merging
arXiv:2604.20985v1 Announce Type: cross 抽象:機械学習アプリケーションにおいて、推論やデプロイ時のプライバシー要件は、多様なポリシーや規制、ユーザーエクスペリエンスの変化に応じて常に変化する可能性があります。本稿では、既存のモデルセット(同じデータセット上で、異なるプライバシーとユーティリティのトレードオフが設定されたモデル)を前提として、追加のトレーニング...
Original: arXiv:2604.20985v1 Announce Type: cross Abstract: In machine learning applications, privacy requirements during inference or deployment time could change constantly due to varying policies, regulatio...
MIATTs を用いた LAF ベースの評価および UTTL ベースの学習戦略
LAF-Based Evaluation and UTTL-Based Learning Strategies with MIATTs
arXiv:2604.20944v1 発表タイプ:クロス 要約:多くの実世界における機械学習 (ML) アプリケーションにおいて、曖昧さや主観的情報の存在により、真のターゲットを正確に定義することが困難です。この課題に対処するため、現実世界において ML タスクの真のターゲットが客観的に存在すると仮定しない条件下で、EL-MIATTs(多様な不正確な真のターゲットを用いた評価と学習)フレームワー...
Original: arXiv:2604.20944v1 Announce Type: cross Abstract: In many real-world machine learning (ML) applications, the true target cannot be precisely defined due to ambiguity or subjectivity information. To a...
HARBOR:自動化されたハルネス最適化
HARBOR: Automated Harness Optimization
arXiv:2604.20938v1 Announce Type: cross 摘要:長期的な言語モデルエージェントは、コード行数と運用の複雑さにおいて、その下層にあるモデルよりもそれをラップする「ハルネス」によって支配されています:コンテキストの圧縮、ツールのキャッシュ、意味記憶、軌道の再使用、推測的なツール予測、そしてモデルをサンドボックス実行環境に結合するグルーである。我々は、ハルネス設計が...
Original: arXiv:2604.20938v1 Announce Type: cross Abstract: Long-horizon language-model agents are dominated, in lines of code and in operational complexity, not by their underlying model but by the harness th...
デジタルツインオペレータの意思決定支援におけるデータ駆動型オープンループシミュレーション(廃水処理)
Data-Driven Open-Loop Simulation for Digital-Twin Operator Decision Support in Wastewater Treatment
Abstract: 廃水処理場(WWTP)には、規定的制御計画下での施設応答をシミュレーションし、不規則で欠落したセンサーデータにも耐え、12〜36時間の計画範囲において依然として情報価値を保持できる、デジタルツインスタイルの意思決定支援ツールが必要である。これら要件をフルスケール施設のデータで満たすことは、未解決の工学・AI の課題となっている。本稿では、歴史的状態の推定と将来の制御・外生ロール...
Original: arXiv:2604.20935v1 Announce Type: cross Abstract: Wastewater treatment plants (WWTPs) need digital-twin-style decision support tools that can simulate plant response under prescribed control plans, t...
IRIS: 連続調整可能な Rényi ベースの反復自己対戦による大規模言語モデルの微調整
IRIS: Interpolative R\'enyi Iterative Self-play for Large Language Model Fine-Tuning
arXiv:2604.20933v1 発表型:クロス 要約:自己対戦による微調整(self-play fine-tuning)は、追加された人間によるアノテーションなしに、大規模言語モデルを監督済み微調整を超えて進化させることを可能にします。既存の多くの手法は固定された散発的な制約に依存しています。SPIN は KL 分散に基づく制約と密接に関連し、SPACE はノイズコントラスト估计を用いた J...
Original: arXiv:2604.20933v1 Announce Type: cross Abstract: Self-play fine-tuning enables large language models to improve beyond supervised fine-tuning without additional human annotations by contrasting anno...
RAG における適応型防御の編成: 多ベクター攻撃に対する哨兵戦略家アーキテクチャ
Adaptive Defense Orchestration for RAG: A Sentinel-Strategist Architecture against Multi-Vector Attacks
arXiv:2604.20932v1 発表タイプ:横断 要約: 検索拡張生成(RAG)システムは、医療や法廷などの敏感なドメインで、専用ドメイン知識に依存して展開されつつあります。この機能は、所属推論、データポイソニング、意図しないコンテンツ漏洩を含む重大なセキュリティリスクをもたらします。直感的な緩和策は、全ての関連防御を同時に有効にするところですが、これには多大なユーティリティコストがかかり...
Original: arXiv:2604.20932v1 Announce Type: cross Abstract: Retrieval-augmented generation (RAG) systems are increasingly deployed in sensitive domains such as healthcare and law, where they rely on private, d...
SafeRedirect: フロントIERLLMにおける内部安全崩壊をタスク完了再導向によって破る
SafeRedirect: Defeating Internal Safety Collapse via Task-Completion Redirection in Frontier LLMs
arXiv:2604.20930v1 Announce Type: cross Abstract: 内部安全崩壊 (Internal Safety Collapse, ISC) は、正規のプロフェッショナルタスクにおいて、正しい完了が構造的に有害な内容の生成を必要としつつ、境界 LLM が自動的にその有害な内容を読み出して、失敗率が 95% を超える現象である。既存の入力レベルの防御は ISC に...
Original: arXiv:2604.20930v1 Announce Type: cross Abstract: Internal Safety Collapse (ISC) is a failure mode in which frontier LLMs, when executing legitimate professional tasks whose correct completion struct...
ドメイン認識階層的対比学習による半教師付汎化故障診断
Domain-Aware Hierarchical Contrastive Learning for Semi-Supervised Generalization Fault Diagnosis
arXiv:2604.20928v1 Announce Type: cross 要約: 未見作業条件下の故障診断は、ラベル付けされたデータが限られている場合、非常に困難です。半教師付ドメイン汎化故障診断 (SSDGFD) は、ラベル付けされたデータと未ラベル付けされたソースドメインを共同で活用することで、実用的な解決策を提供します。しかし、既存の手法はまだ 2 つの相互に関連する限界に苦しんでいま...
Original: arXiv:2604.20928v1 Announce Type: cross Abstract: Fault diagnosis under unseen operating conditions remains highly challenging when labeled data are scarce. Semi-supervised domain generalization faul...
取らない道:実行に関する推論における対偶性
The Path Not Taken: Duality in Reasoning about Program Execution
arXiv:2604.20917v1 Announce Type: cross 要旨:大規模言語モデル(LLMs)は、多様なコーディングタスクにおいて驚くべき能力を示しており、その採用には、表面的なパターンに頼ることなく実行の真の理解を必要とします。既存ベンチマークは、特定の入力と結びついたプログラムの属性を予測すること(例:コードのカバレッジ、プログラムの出力)に主に焦点を当てており、これにより...
Original: arXiv:2604.20917v1 Announce Type: cross Abstract: Large language models (LLMs) have shown remarkable capabilities across diverse coding tasks. However, their adoption requires a true understanding of...
Absorber LLM: Causal Synchronization を活用したテスト時の学習
Absorber LLM: Harnessing Causal Synchronization for Test-Time Training
arXiv:2604.20915v1 Announce Type: cross 要約:Transformer は自己注意によってシーケンス長とともに計算コストが高くなり、長期のストリームにおける推論をメモリの消費によって禁止しています。Constant-memory の代替方法である RNN と SSM は、履歴を固定されたサイズの状態に圧縮することで、長期的な依存関係を失い、パラメータにコンテキ...
Original: arXiv:2604.20915v1 Announce Type: cross Abstract: Transformers suffer from a high computational cost that grows with sequence length for self-attention, making inference in long streams prohibited by...
Long-Context LLM エージェントにおいて、漏れ制約は減衰する一方、委細制約は維持される:セキュリティ・リコール分岐 (SRD)
Omission Constraints Decay While Commission Constraints Persist in Long-Context LLM Agents
arXiv:2604.20911v1 Announce Type: cross 摘要:本格的運用に配備された LLM エージェントは、オペレーターが定義した行動ポリシー(認証情報の開示、データ流出、および未承認出力に関する禁止命令などのシステムプロンプト指示)に基づいて動作し、安全性評価はこれらの制約が対話全体を通じて維持されていると仮定している。コンテキストの圧力に晒されると禁止タイプ(pro...
Original: arXiv:2604.20911v1 Announce Type: cross Abstract: LLM agents deployed in production operate under operator-defined behavioral policies (system-prompt instructions such as prohibitions on credential d...
Planetary Exploration 3.0: A Roadmap for Software-Defined, Radically Adaptive Space Systems
arXiv:2604.20910v1 Announce Type: cross 摘要: 火星の地表と地下以外の世界は、まだ大規模に未探索のままです。しかし、これらの世界は惑星科学の根本的な問いの答えを秘めています。氷星の潜在的に居住可能な地下海から、カイパー帯天体に保存された古代記録まで。NASA の火星探査の成功は、段階的アプローチによって達成されました:数十年にわたり、22 つの徐々に高度化す...
Original: arXiv:2604.20910v1 Announce Type: cross Abstract: The surface and subsurface of worlds beyond Mars remain largely unexplored. Yet these worlds hold keys to fundamental questions in planetary science ...
PoSyMed による生体医療システム生物学的研究ワークフローのオーケストレーションと実行
Biomedical systems biology workflow orchestration and execution with PoSyMed
arXiv:2604.20906v1 Announce Type: cross 本文書では、生物情報学リサーチにおいて実際の障壁となっている急速な科学ソフトウェアの成長について言及します。強力な統計的、人工知能(AI)ベースの手法は現在広く利用可能となっていますが、それらの有効な使用は断片的な配信、一貫しないドキュメント、複雑な依存関係、および再現性の低い実行環境によって妨げられていることがよく...
Original: arXiv:2604.20906v1 Announce Type: cross Abstract: The rapid growth of scientific software has created practical barriers for bioinformatics research. Although powerful statistical, artificial intelli...
規範的擬像から文学作品によるプライバシー思考の強化:LLM への適用
Reinforcing privacy reasoning in LLMs via normative simulacra from fiction
arXiv:2604.20904v1 発表タイプ:横断 要旨: 大規模言語モデル(LLM)エージェントの情報管理手法は、ユーザーの文脈的プライバシー期待と広範に一致していません。文脈的完全性(Contextual Integrity, CI)は、プライバシーを文脈相対的な規範内の情報の適切な流通として定義する原則的な枠組みを提供しますが、既存のアプローチは監督者アシスタントアーキテクチャを通じて推...
Original: arXiv:2604.20904v1 Announce Type: cross Abstract: Information handling practices of LLM agents are broadly misaligned with the contextual privacy expectations of their users. Contextual Integrity (CI...
周波数強制: スケーリング・アズ・タイムからソフト周波数誘導へ
Frequency-Forcing: From Scaling-as-Time to Soft Frequency Guidance
arXiv:2604.20902v1 Announce Type: cross 要約: 標準的なフローマッチングモデルがノイズをデータに均一に移動させる一方で、明確な生成順序(粗い低周波成分から細かい高周波詳細へと順序立てる)を導入することで、自然画像の合成において高い効果が得られていることが証明されています。最近の 2 つの研究が、この分野の異なるパラダイムを提示しています。K-Flow は周波...
Original: arXiv:2604.20902v1 Announce Type: cross Abstract: While standard flow-matching models transport noise to data uniformly, incorporating an explicit generation order - specifically, establishing coarse...
Large Language モデルを用いた金属有机骨格(MOF)合成プロセスの規模拡大予測
Predicting Scale-Up of Metal-Organic Framework Syntheses with Large Language Models
arXiv:2604.20899v1 Announce Type: cross アブストレイクト: 大規模合成は、金属有机骨格(MOF)の発見から工業的実装へと続く門番であり、そのための知識は disparate(異質で断片的な)レポートに分散しています。本研究では、ESU-MOFという文書解析されたデータセットとポジティブ・ラベルなし学習戦略を導入し、大規模言語モデルを微調整します。これにより...
Original: arXiv:2604.20899v1 Announce Type: cross Abstract: Scalable synthesis remains the gate between MOF discovery and industrial deployment, as scale-up know-how is fragmented across disparate reports. We ...
ワッツ・パー・インテリジェンス 第 2 部:アルゴリズム的触媒催化作用
Watts-per-Intelligence Part II: Algorithmic Catalysis
arXiv:2604.20897v1 Announce Type: cross 要約:ワッツ・パー・インテリジェンス枠組み内におけるアルゴリズム的触媒催化作用の熱力学的理論を確立し、タスククラスに対して不可逆演算数を削減しつつ、有限の再構成および構造選択性を満たす再利用可能な計算構造を特定しました。基体とクラス記述子間のアルゴリズム的相互情報量は、任意のクラス固有の高速化を上限に定めることを証明...
Original: arXiv:2604.20897v1 Announce Type: cross Abstract: We develop a thermodynamic theory of algorithmic catalysis within the watts-per-intelligence framework, identifying reusable computational structures...