2031 articles
STEP: 協調動作予測を用いた温め付けられた視覚運動政策
STEP: Warm-Started Visuomotor Policies with Spatiotemporal Consistency Prediction
最近、diffusion policyはロボットの操作に適用されることが可能な視覚運動制御の強力なパラダイムとして現れてきています。それは行動一連の分布と多モーティリティをモデル化する能力があります。しかし、デノイジングによる反復は重大な推論遅延を引き起こしリアルタイムクロージド・ループシステムでの制御周期を拡大します。既存のスピードアップメソッドはサンプリングステップを減らしたり直感的に推定を取...
Original: arXiv:2602.08245v1 Announce Type: cross Abstract: Diffusion policies have recently emerged as a powerful paradigm for visuomotor control in robotic manipulation due to their ability to model the dist...
パラフレーズ生成と検出による言語モデル化と理解
Language Modeling and Understanding Through Paraphrase Generation and Detection
人間が知識を共有し、世界を理由的に考え、世代を横断して生存戦略やイノベーションの方法を伝播するプロセスには、言葉の能力を超えた適応性があります。つまり、異なる単語と構造で同じ思想を表現できるのです。これこそがパラフレーズであり、意味の核となる言語モデルの強調点を握り締めています。同定や生成を行うことができる複雑な機械学習モデルも、それが持つ同一の意味を持続させたりしない、異なる意味を持つ新たなパタ...
Original: arXiv:2602.08274v1 Announce Type: cross Abstract: Language enables humans to share knowledge, reason about the world, and pass on strategies for survival and innovation across generations. At the hea...
一次式の対称性破壊制約の自動生成
Automatic Generation of Polynomial Symmetry Breaking Constraints
整数計画問題における対称性は、冗長な探索を引き起こし、しばしば対称性破壊制約を使用してできるだけ多くの同等解を取り除きます。我々は、必要とする入力が特定の一元式とグループの置換である任意のベース一元式に対して、代数学的な方法に一組の一元式不等式を作成し、「対称性破壊制約」を使用可能にすることができます。この計算は主要な符号計算ソフトウェアで簡単に実行できます。我々のアプローチをテストするためには数...
Original: arXiv:2602.08297v1 Announce Type: cross Abstract: Symmetry in integer programming causes redundant search and is often handled with symmetry breaking constraints that remove as many equivalent soluti...
SWE ワイヤーベント ボーンチ: データ学習の評価基準
SWE Context Bench: A Benchmark for Context Learning in Coding
大規模な言語モデルは、リポジトリレベルのソフトウェア工工程事タスクをプログラム代理体として日益増しており、これは現実のコードベースでの正誤に基づいて評価される多くのベンチマークと似ています。しかし、最近のこれらのベンチマークでは、いくつかのタスクが独立性に基づき評価され、関連問題で経験材料を再利用することは評価されていません。そのため、経験蓄積、参照、適用の能力、そしてその再利用による効率的なガ ...
Original: arXiv:2602.08316v1 Announce Type: cross Abstract: Large language models are increasingly used as programming agents for repository level software engineering tasks. While recent benchmarks evaluate c...
思考状態による隠れ推論:-supervised-thinking-states
Latent Reasoning with Supervised Thinking States
Latent Reasoning with Supervised Thinking Statesは、Large Language ModelsでChain-of-Thoughtでの複雑なタスクを解き、生成すると長期の理屈が必要になります。そのため、負担が大きくかかりますが、この問題に対する解決策は、Inputが処理されるときにThinking Statesという方法で推論を行うことができますことを...
Original: arXiv:2602.08332v1 Announce Type: cross Abstract: Reasoning with a chain-of-thought (CoT) enables Large Language Models (LLMs) to solve complex tasks but incurs significant inference costs due to the...
量子美学のルーチン: アバストレート
Roadmap to Quantum Aesthetics
量子力学は現代の科学の中心的な地位を占めていますが、物理的手感では直接的で観察できないままです。この論文では、芸術的表現を通じて抽象的に量子的概念を美意識に転写するためのルーチン路線を描き出しました。2つの相互に関連して非対応的なアプローチが明言されています。第一は、階級上のアプローチであり、生成性的AIと説明文字のポットに基づいて量子美意識を、大量のトレーニングデータ埋め込まれた文化的構築として...
Original: arXiv:2602.08363v1 Announce Type: cross Abstract: Quantum mechanics occupies a central position in contemporary science while remaining largely inaccessible to direct sensory experience. This paper p...
圧縮されたメモリを用いた動的長_context推理:エンドツイートの再学習による終到点の選択
Dynamic Long Context Reasoning over Compressed Memory via End-to-End Reinforcement Learning
大型言語モデル(LLMs)は、大量な文脈処理に大きな課題を克服しています。この困難は通常の計算コストの二番目の方と情報抹消、RAGによる増幅された生成の利用によるクッションフラキッジなどから来ています。我々は長文入力に対する効率的な長文インスタンス推論に関する知能主義の意図したフレームワークを提案しました。これは長い入力を分割し、コンピュートラーゼムを使用してそれぞれの分割した情報塊を圧縮されたメ...
Original: arXiv:2602.08382v1 Announce Type: cross Abstract: Large Language Models (LLMs) face significant challenges in long-context processing, including quadratic computational costs, information forgetting,...
意思的理解によるヒューマン・オーケストラシに対して:再設計学習と凝視スリンテーションを組み合わせることで個別化のハイライトをする
Intelligent support for Human Oversight: Integrating Reinforcement Learning with Gaze Simulation to Personalize Highlighting
インターフェイスが、時間制限の下での利用者の状況認識を効果的に支援する必要があります。本研究は、再設計学習 (RL) をベースとしたユーザー向け UI の調整を行った個人的な警告戦略の個別化をするためです。それによって、重要なイベントに関しては表示を強調することで得られる利益と、中断によって発生する意識的な負担とのバランスを見つけることができます。 リアルワールドで行うのに必要な学習に取り組むため...
Original: arXiv:2602.08403v1 Announce Type: cross Abstract: Interfaces for human oversight must effectively support users' situation awareness under time-critical conditions. We explore reinforcement learning ...
Optimizing Spectral Prediction in MXene-Based Metasurfaces Through Multi-Channel Spectral Refinement and Savitzky-Golay Smoothing
MXeneベースの太陽吸収体を使用した電磁スペクトラム予測の最適化は、伝統的に全波スライダを使用して計算に時間がかかる重要なタスクです。この研究ではマルチチャンネルスペクトラ修復(MCSR)とSavitzky-Golayフィルタリングを統合した深層学習フレームワークを導入し、スペクトル予測の効率と正確性を向上させます。提案されたアーキテクチャは、細調処理されただけの事前トレーニングされたMobil...
Original: arXiv:2602.08406v1 Announce Type: cross Abstract: The prediction of electromagnetic spectra for MXene-based solar absorbers is a computationally intensive task, traditionally addressed using full-wav...
LLMs +セキュリティ = 問題
LLMs + Security = Trouble
我々は、AIを用いて堅牢なコードを作成することについての現行の「火を撃つための火を撃つ」のアプローチ、「確率的でAIベースのチェッククッカーまたは攻撃者を使用し、確率的に生成されたコードのセキュリティを保護する」というアプローチが、長期にわたるセキュリティバグに対処しないことを主張しています。 したがって、システムはゼロデイ攻撃の脆弱性に対しても容易には触れられず、それらの敵が資源的に豊富で長期的...
Original: arXiv:2602.08422v1 Announce Type: cross Abstract: We argue that when it comes to producing secure code with AI, the prevailing "fighting fire with fire" approach -- using probabilistic AI-based check...
分散化されたWi-Fiの局所空間再使用最適化: 内部の悔恨最小化アプローチ
Decentralized Spatial Reuse Optimization in Wi-Fi: An Internal Regret Minimization Approach
分散的なスパースリープ(SR)パラメータ -- テレポダイゼーション(TP)レベルとカリアーセンシングしきい値(CST) -- の最適化は、IEEE 802.11 ディープスケールに密度の高いネットワークにおいて効果的なスペクトラム効率向上のための費用対効果が高く、同期送信によるものです。しかしながら、各ブロードキャップセット(BSS)間で分散化最適化は困難であることは、グローバルな状態情報の非存...
Original: arXiv:2602.08456v1 Announce Type: cross Abstract: Spatial Reuse (SR) is a cost-effective technique for improving spectral efficiency in dense IEEE 802.11 deployments by enabling simultaneous transmis...
CLEAR: アセントした知識に基づく vessels の航路解析プラットフォーム
CLEAR: A Knowledge-Centric Vessel Trajectory Analysis Platform
船舶の航路データは、自動識別システム(AIS)からは広く利用されていますが、専門知識のないユーザーは、AIS データの不完備性と複雑さに対応するのが困難です。私たちは、 CLEAR を発表します。これは知識に基づいた vessels の航路解析プラットフォームで、これらの障壁を乗り越えることを目指しています。 事実上の論理や生成的な能力を持つ Large Language Models(LLMs)...
Original: arXiv:2602.08482v1 Announce Type: cross Abstract: Vessel trajectory data from the Automatic Identification System (AIS) is used widely in maritime analytics. Yet, analysis is difficult for non-expert...
一般比例性の理論に加算utilityを適用したモデル
A General Theory of Proportionality with Additive Utilities
我々は、候補者が選ばれるための投票者偏好に基づいてグループを選定するモデルを考えています。このモデルは、どのグループを選べば良いかを具体的に指定する一般既約条件を組み込みます。これは多様性制約付きのカンパaign選択や包括的予算(資金配分における特定の規則)など、さまざまな場面に拡張できます。この一般的なモデルでは、最近幾つかの比例性のエトックスが定義されました。しかし提案されたルールは全ての投票...
Original: arXiv:2602.08504v1 Announce Type: cross Abstract: We consider a model where a subset of candidates must be selected based on voter preferences, subject to general constraints that specify which subse...
GISAC:一般情報探求アシスタントのベンチマーク
GISA: A Benchmark for General Information-Seeking Assistant
大規模言語モデル(LLMs)の進歩は、マルチトーンウェブインタラクションを通じて自主的な情報を取得するデジタルス redevelep agentsの発展を大幅に加速しました。さまざまなベンチマークが提案されていましたが、これらの中には、答えから逆算した質問を作成し評価することに重点が置かれています。この結果、実世界のニーズと相違のある unnaturalなタスクが作成されています。また、これらのベ...
Original: arXiv:2602.08543v1 Announce Type: cross Abstract: The advancement of large language models (LLMs) has significantly accelerated the development of search agents capable of autonomously gathering info...
AIシステムリスクへの対応:代理人による予測支援とアシスタントによるテクノロジーの評価
Agent-Supported Foresight for AI Systemic Risks: AI Agents for Breadth, Experts for Judgment
AIの影響評価では、短期間のリスクの重視が一般的ですが、専門家の知識が稀缺な長い時間軸でリスクがより重要になります。長期的でシステム的なリスクに対処するためには、シンセサーシミュレーションを使用した代理人を用いた予測支援方法を開発しました。「Futures Wheel」という戦略的な予測法に基づいて、AIの使用4つの例(チャットボットコンシェルジュとエンターテイナー、ゴーストボットと死のアプリケー...
Original: arXiv:2602.08565v1 Announce Type: cross Abstract: AI impact assessments often stress near-term risks because human judgment degrades over longer horizons, exemplifying the Collingridge dilemma: fores...
Kissan-Dost:小規模農家用の精准農業に最後の距離を結ぶコンシェルチュアIoT
Kissan-Dost: Bridging the Last Mile in Smallholder Precision Agriculture with Conversational IoT
私たちには、多言語でセンサーグランドされたコミュニケーションシステムであるKissan-Dostがあります。これは生産現場での農場測定や天候情報から単純な表現のガイダンスをWhatsAppのテキストや音声に送り込んでいます。システムは、商品土壌と気象センサーとの組み合わせと検索増強生成法を利用し、モジュールパイプラインを介して地基化、トレーサビリティ、そして proactive ャウットが保証され...
Original: arXiv:2602.08593v1 Announce Type: cross Abstract: We present Kissan-Dost, a multilingual, sensor-grounded conversational system that turns live on-farm measurements and weather into plain-language gu...
6G-Bench: AIベースのAI-Native 6Gネットワークにおける意味的通信とネットワークレベルの推論に対する開発検証の標準 benchmarks
6G-Bench: An Open Benchmark for Semantic Communication and Network-Level Reasoning with Foundation Models in AI-Native 6G Networks
この文書では、6G-Benchについて紹介します。これは、オブジェクトが30の意思決定タスク(T1〜T30)を抽出した分類されたためのAIベースの6Gネットワークにおける意味的通信とネットワークレベルの推論に対する公開検証です。 6G-Benchは、これらすべてのタスクに基づく標準化活動(3GPP、IETF、ETSI、ITU-T、O-RAN協会)を経由し、5つの統一戦略カテゴリーに整理します。11...
Original: arXiv:2602.08675v1 Announce Type: cross Abstract: This paper introduces 6G-Bench, an open benchmark for evaluating semantic communication and network-level reasoning in AI-native 6G networks. 6G-Benc...
PBLean: プセーモーボール証拠文書を Lean 4 にインポートする方法
PBLean: Pseudo-Boolean Proof Certificates for Lean 4
弊社は、VeriPB 偽りのボルト(PB)証拠文書を Lean ジュニア4で使用する方法であるPBLeanを発表します。我々のアプローチでは、反射が重要な役割を果たします: Leang内の全ての定式化ルールをサポートし、完全に確認されたバイナリなコード上で推導できる「すべては対応する」関数です。この方法は、証拠文書自体だけではなく、十兆ステップまで伸縮可能です。これにより、これらの問題が解決可能な...
Original: arXiv:2602.08692v1 Announce Type: cross Abstract: We present PBLean, a method for importing VeriPB pseudo-Boolean (PB) proof certificates into Lean 4. Key to our approach is reflection: a Boolean che...
理想感情認識技術(ERT)のテコソーシアルリスク:感情表現の社会的価値を擁護する
Technosocial risks of ideal emotion recognition technologies: A defense of the (social) value of emotional expressions
理想的な感情認識技術(ERTs)は、AIシステムとして有望とされており、それがシニカル・ソーシャル透明性への社会が利益を得るとの仮定はしばしばあります。本文では、理想的なERTsである多モーダルシステムの実際的なリアルタイム的な内なる感情状態を予想するテコソーシャルリスクを検討することで、この仮定に挑戦します。哲学的・論理的情感表現と社会行動に基づいた議論及び感情科学や社会心理学の業績から、私はそ...
Original: arXiv:2602.08706v1 Announce Type: cross Abstract: The prospect of AI systems that I call ideal emotion recognition technologies (ERTs) is often defended on the assumption that social life would benef...
Scylla理解:编程海中多头怪兽代理daemonの調査
Taming Scylla: Understanding the multi-headed agentic daemon of the coding seas
LLMベースツールは高速でソフトウェア開発タスクを自動化していますが、異なる構造選択、プ_PROMPTs、スキル、ツール、マルチジェネレータセットアップなど違いの評価は現れていません。この論文で「Scylla」という評価フレームワークを導入し、アグェテンタルなコーディングツールに対する比較検討において、複雑性と効率性を直接影響させる何が影響を与えているかを見つけ出すために7つのテストステージ(T0...
Original: arXiv:2602.08765v1 Announce Type: cross Abstract: LLM-based tools are automating more software development tasks at a rapid pace, but there is no rigorous way to evaluate how different architectural ...