2031 articles

エージェント安全性の視覚的盲点：無害なユーザー指示がコンピュータ利用エージェントの重大な脆弱性を浮き彫りにする

The Blind Spot of Agent Safety: How Benign User Instructions Expose Critical Vulnerabilities in Computer-Use Agents

arXiv:2604.10577v2 発表タイプ：置換クロス要約：コンピュータ利用エージェント（CUA）は、今や実世界というデジタル環境で複雑なタスクを自律的に完了できますが、誤導された場合、有害なアクションをプログラムとして自動化するために利用されてしまうこともあります。既存の安全性評価は、不正利用やプロンプト注入など明らかな脅威を対象としていますが、ユーザー指示が完全に無害で、危害が発生する...

Original: arXiv:2604.10577v2 Announce Type: replace-cross Abstract: Computer-use agents (CUAs) can now autonomously complete complex tasks in real digital environments, but when misled, they can also be used t...

エージェント安全性の視覚的盲点：無害なユーザー指示がコンピュータ利用エージェントの重大な脆弱性を浮き彫りにする

MR-Coupler: 機能結合解析に基づく自動化されたメタモルフィックテスト生成

STRIDE-ED: エモパシー型会話システムのための戦略に根差した段階的推論フレームワーク

Context-Agent：非線形対話のための動的対話ツリー

Spectral Tempering for Embedding Compression in Dense Passage Retrieval

ArrayTac: Closed-loop Piezoelectric Tactile Platformを介した形状、剛性、摩擦の連続可変レンダリング

Preconditioned Test-Time Adaptation for Out-of-Distribution Debiasing in Narrative Generation

パペットかパートナーか？デジタル公共圏におけるサイバーゴング言説の統治

新出現する AI エージェントプロトコルにおけるセキュリティ脅威モデル：MCP、A2A、Agora、ANP の比較分析

Capture the Flags: Semantic-Conserving Transformationsを用いたアジェント型 LLM の家族ベース評価

Losses that Cook: Structured Recipe Generationのためのトポロジカル最適輸送

VLegal-Bench: 大規模言語モデルのベトナム法理論の認知基盤に優れたベンチマーク

TPA: RAG の嘘発見のための次トークン確率帰属

言語モデルがセマンティックな教師：医療音声理解のためのトレーニング後の整列

地域暖房駅における予知保全の促進：サービスデータを基にしたラベル付与データセットと不具合検出評価枠組み

MCQ を越える：方言バリエーションを含むオープンエンドなアラビア語文化的 QA ベンチマーク

検索が失敗する時：Web 拡張型大規模言語モデルのレッドチーム

AISysRev -- 論文タイトル・要約のスクリーニングを支援する LLM ベースのツール

RoleConflictBench：LLM の文脈的感受性を評価するための役の衝突シナリオベンチマーク

WARBERT: Web API 推薦のための階層型 BERT ベースモデル