2031 articles
rich-arq: 1ビットの確認から情報豊かなニューラルコードフィードバックへ
Rich-ARQ: From 1-bit Acknowledgment to Rich Neural Coded Feedback
本稿は、伝送通信における基本的なフィードバックメカニズムを再解釈し、現状の1ビットの二進ACK/NACKに高次元で情報を満載したベクターフィードバックを使用することで、静的確認から主動的な協働へと変更しています。我々はRich-ARQというパラダイムを提案し、伝送ターゲルと受信機間のコラボレーション物理層のデータエンコーディングにニューラルコードフィードバックを使用することを示唆します。実現のため...
Original: arXiv:2602.07886v1 Announce Type: cross Abstract: This paper reimagines the foundational feedback mechanism in wireless communication, transforming the prevailing 1-bit binary ACK/NACK with a high-di...
レビューデータに基づくリスティングエージェント生成のテストが意味を持つべきでないか:自動ソフトウェア工事を使用するための質疑応答式
Rethinking the Value of Agent-Generated Tests for LLM-Based Software Engineering Agents
大きな言語モデル(LLM)コードエージェントは、問題を解決しやすいようにリポジトリレベルの問題に反復的にコードを変更し、ツールを呼べばバリデーションをチェックします。これらのワークフローでは、エージェントはよくテストを作成するという一般的なパラダイムを持っており、SWE-benchでランカートップ10内の多くのエージェントもそれに従っています。しかし、GPT-5.2は新しいテストをほとんど作ってい...
Original: arXiv:2602.07900v1 Announce Type: cross Abstract: Large Language Model (LLM) code agents increasingly resolve repository-level issues by iteratively editing code, invoking tools, and validating candi...
測定同期と圧縮に伴うIncrementalマッピング
Incremental Mapping with Measurement Synchronization & Compression
現代の自律走行車両とロボットは、多機能センサーを用いて地点測位とマップ作成を行っています。これらのマップには正確性が必要であり、正確な環境の表現は安定した位置情報化のための前提条件です。グラフファctorはセンサ融合に対して優れた解決策を提供し、最大後行確率解を推定する能力があります。しかし、グラフベースの表現法の離散性とスケンソーメーカー間隔した測定が結合状態の推定に取り組むのが難しいことがわか...
Original: arXiv:2602.07901v1 Announce Type: cross Abstract: Modern autonomous vehicles and robots utilize versatile sensors for localization and mapping. The fidelity of these maps is paramount, as an accurate...
複雑な危機的な石油施設管理のために最適化された人-Robotチームスケジューリング
Optimized Human-Robot Co-Dispatch Planning for Petro-Site Surveillance under Varying Criticalities
石油インフラストラクチャーセキュリティは、 autonomiesystemの効率と人的判断をバランスさせることが重要です。これは古典的なファシルティー場所モデルを超えて存在する課題であり、それは同じ資源を持つことを前提にしています。この研究では「Human-Robotコダッシュファシルティー場所問題(HRCD-FLP)」を作り出し、補給能力を考慮したファシルティー場所問題の変種を含みました。この問...
Original: arXiv:2602.07924v1 Announce Type: cross Abstract: Securing petroleum infrastructure requires balancing autonomous system efficiency with human judgment for threat escalation, a challenge unaddressed ...
Bielik Guard:効率的なLLMコンテンツモデレーション用のポーランド語安全分類器
Bielik Guard: Efficient Polish Language Safety Classifiers for LLM Content Moderation
大規模言語モデル(LLMs)がポーランド語アプリケーションに広くデプロイされるにつれて、内容に関するセキュリティ分類への需要はますます大きくなってきました。我々はBielik Guardというポーランド語の安全分類器のファミリーをご紹介します。これらのおもちゃ箱のようなポーランド語の安全分類器は2つのモデルバリアントにまとめられています:0. 1 ビリットモデルと0. 5 ビリットモデルです。両方...
Original: arXiv:2602.07954v1 Announce Type: cross Abstract: As Large Language Models (LLMs) become increasingly deployed in Polish language applications, the need for efficient and accurate content safety clas...
LLMの事前処理をカーボンレベラーに委ねるためのエラー-デライネーティブ取引
Accuracy-Delay Trade-Off in LLM Offloading via Token-Level Uncertainty
Large language models(LLMs)は、スマートなモバイルシグナル提供が期待できますが、リソース制限の設備で計算的重負がかかります。モバイルエッジコンピューティング(MEC)はそのようなデバイスがエッジサーバー(ESs)にインファーザツタスクをオフロードするのを許可します、それが通信とサーバサイドのプールリングによる遅延を与えるかもしれませんが、特にマルチユーザー環境の場合です。...
Original: arXiv:2602.07958v1 Announce Type: cross Abstract: Large language models (LLMs) offer significant potential for intelligent mobile services but are computationally intensive for resource-constrained d...
翻訳できない?複合ハーモスのクロス言語移りについての比較分析
Lost in Translation? A Comparative Study on the Cross-Lingual Transfer of Composite Harms
大量の言語モデル(LLMs)の安全管理評価は、大半が英語に根ざされています。対象を多くするため、翻訳を利用することはしばしばありましたが、それは全体像を全面的に捉えることはありません。有害な意図や構造が言語を変えた後の転写事例では特に如此で、何種類かの種類のハーモスはほとんど完璧に持続しましたが、他のものは歪曲または消滅することもあります。複合ハーモスを目的とした翻訳ベースのベンチマークについてこ...
Original: arXiv:2602.07963v1 Announce Type: cross Abstract: Most safety evaluations of large language models (LLMs) remain anchored in English. Translation is often used as a shortcut to probe multilingual beh...
DeltaKV:長距離類似性に基づくKVキャッシュ圧縮方法
DeltaKV: Residual-Based KV Cache Compression via Long-Range Similarity
高精度な長い文脈のあるLLMsのアプリケーション(自律型オブジェクト、連鎖考え、創造的な作文など)での展開は fundamentally、多くのKVキャッシュメモリの増加が瓶颈になります。 現代の圧縮と退避方法は精度、圧縮割合、ハードウェア効率をバランスよく維持しにくいです。 特定の原因である長距離間のトークンの類似性とKV表示化に含まれる多くの共有した隠れたコンポーネントに基づき、DeltaKV...
Original: arXiv:2602.08005v1 Announce Type: cross Abstract: The deployment of efficient long-context LLMs in applications like autonomous agents, long-chain reasoning, and creative writing is fundamentally bot...
ICBAC:サプライチェーン管理においてブロックチェーンとファederated learningを組み合わせた知能化販売制御フレームワーク
ICBAC: an Intelligent Contract-Based Access Control framework for supply chain management by integrating blockchain and federated learning
この論文は現代のサプライチェーンにおけるアクセス制御への課題に焦点を当てています。このチェーンは複数の独立した企業によって運営され、競争関係にあるためです。現在のアクセス制御は静的なもので集中型であり、内通攻撃や変動する状況に対応できず、内部攻撃に対する対応力も不足しています。ブロックチェーンにより分散化が改善されていますが、行動的な知能を持たずにあります。一方の中央集約された機械学習用の異常警報...
Original: arXiv:2602.08014v1 Announce Type: cross Abstract: This paper addresses the critical challenge of access control in modern supply chains, which operate across multiple independent and competing organi...
サイバーエキスプローラー:LLM の攻撃的安全な能力のベンチマークに適用された実世界の攻撃シミュレーション環境
CyberExplorer: Benchmarking LLM Offensive Security Capabilities in a Real-World Attacking Simulation Environment
本稿では、現実のワールドのオフラインセキュリティ実行操作はほぼ確定的な結果を求める閉じた世界で定められた目的に基づいた事例が含まれていない実際であり、攻撃者が未知の攻撃面積を探索、不安定な仮説の修正や指定した成功基準なしに無担保での行動を行うこと。LLM に基づくオフラインセイントエージェントの評価は閉じた世界で行われるためです。我々は実際には未知の攻撃面を含むため、サイバーエキスプローラー:開発...
Original: arXiv:2602.08023v1 Announce Type: cross Abstract: Real-world offensive security operations are inherently open-ended: attackers explore unknown attack surfaces, revise hypotheses under uncertainty, a...
拡大言語モデルを用いて複雑系の伝播動態に関する研究
Large language models for spreading dynamics in complex systems
伝播動態は、物理的な複雑系やネットワーク科学において重要なトピックであり、情報、行動、病気にわたる相互作用中の体系における伝播によって理解される統合フレームワークです。多くの伝播の場面では、説明、文化、生活環境、認知の傾向、そして公的政策など複数の影響要因が、直接的に古典的なモデリングプラクティクーに取り込むのが困難であるためです。最近では、大型言語モデル(LLMs)は自然言語的理解、再帰的思考、...
Original: arXiv:2602.08085v1 Announce Type: cross Abstract: Spreading dynamics is a central topic in the physics of complex systems and network science, providing a unified framework for understanding how info...
潜在的な理由モデルの Emergent Search と追従
Emergent Search and Backtracking in Latent Reasoning Models
言語モデルが文字で思考することはどのようになるのか?通常の言語モデルは中間ステップを文脈化することで、chain-of-thoughtを実現します。一方、隠れた推論トランスフォーマは、連続的な隠れ空間内ですべての計算を行い、中間ステップは言葉で説明せずです。私たちは、LRTが複数の選択問題を対象とした評価指標において直近の答えを選んで推理していることを見出しました。それについて、モデルが経験した探...
Original: arXiv:2602.08100v1 Announce Type: cross Abstract: What happens when a language model thinks without words? Standard reasoning LLMs verbalize intermediate steps as chain-of-thought; latent reasoning t...
制約されたプライシング:有限な混合ロジットのシナリオ
Constrained Pricing under Finite Mixtures of Logit
混合ロジットモデルは、価格設定と収益管理における柔軟で幅広く使用されている需給モデルです。ただし、現在では混合ロジットの価格設定に関する多数の研究が無制限の状況に焦点を当てるため、実際のビジネスや規制上の制約により価格付けが適応される条件下における価格設定問題には適用範囲が限定されています。我々は、マルチノミナルと混合ロジットモデルに基づく制約された価格設定問題について研究しています。 マルチノミ...
Original: arXiv:2602.08119v1 Announce Type: cross Abstract: The mixed logit model is a flexible and widely used demand model in pricing and revenue management. However, existing work on mixed-logit pricing lar...
DIAL-SUMMER: ダイアログ要約における階層的なエラー評価の構造化フレームワーク
DIAL-SUMMER: A Structured Evaluation Framework of Hierarchical Errors in Dialogue Summaries
ダイアローグは、人間にとって最も一般的なコミュニケーション形態であり、対象のダイヤログとその要約から重要な点を復習し、顧客エンジニアリングや製品ユーザーとの会話レビューを行う際には非常に有効です。ダイアログ要約評価に関する前の研究がこのタスクで特定の複雑性を無視していることに焦点を当てましょう: (i) シトラクトへの変化、つまり、いくつかのターン間で情報について散在的にやり取りしてみたものから、...
Original: arXiv:2602.08149v1 Announce Type: cross Abstract: Dialogues are a predominant mode of communication for humans, and it is immensely helpful to have automatically generated summaries of them (e.g., to...
Nexus: メタデータのみで接続グラフの推定を用いるためのイテーラティブな低ランク行列補完
Nexus: Inferring Join Graphs from Metadata Alone via Iterative Low-Rank Matrix Completion
自動的に接続関係の推測は、効果的なデータ検索・統合・問いや再生という重要なタスクです。しかし、アクセスが制限されており、大規模で複雑なスキーマの中で、多くの場合に正確で効率的におそれるため、その識別には困難があります。この論文では、メタデータだけである接続グラフの推定問題を紹介しています。当社は、これらの一連の新しい観察に基づいて、接続リストグラフの推定を低ランク行列補完問題として形式化し、唯一的...
Original: arXiv:2602.08186v1 Announce Type: cross Abstract: Automatically inferring join relationships is a critical task for effective data discovery, integration, querying and reuse. However, accurately and ...
大型言語モデルを用いた同伴支援組織のヘルスケアサービス:同伴専門家とサービス利用者からの機会、リスク及びメフィズメント戦略に関する理解
Large Language Models in Peer-Run Community Behavioral Health Services: Understanding Peer Specialists and Service Users' Perspectives on Opportunities, Risks, and Mitigation Strategies
同伴支援組織(PRO)は、生活の経験に基づく回復的な精神保健サポートを提供しています。大規模言語モデル(LLMs)がこの場に現れるとそのスケール、会話性、とオフレキシーで新しい対象を設けられる新たな挑戦。ニューベージュ・アメリカ合衆国(NJS)、Collaborative Support Programs(CSPNJ)は州レベルのプロフェッショナル支援のための同伴支援プログラムです。コミュニティが...
Original: arXiv:2602.08187v1 Announce Type: cross Abstract: Peer-run organizations (PROs) provide critical, recovery-based behavioral health support rooted in lived experience. As large language models (LLMs) ...
Correct: コンテキストに関連した確率論的対比に基づくシフト状態校正
CoRect: Context-Aware Logit Contrast for Hidden State Rectification to Resolve Knowledge Conflicts
「記憶強化生成」(RAG)はしばしば知識衝突に直面する傾向があります。それはモデル内部のパラメトリックな知識が抽出された情報に優先します」というモデル内を理解しません。以前のソリューションには主に、表面的な解釈調整や重み編集などが含まれており、これは正確な目標が必要です。層別での分析を通じて、この失敗の原因はパラメトリックな抑制現象だと特定しています:特に、深い層では特定されたFFN層がコンテキス...
Original: arXiv:2602.08221v1 Announce Type: cross Abstract: Retrieval-Augmented Generation (RAG) often struggles with knowledge conflicts, where model-internal parametric knowledge overrides retrieved evidence...
専門ライターの生成 AI との関係とその結果への影響: 単なる敵対心に加えて協力心を持つことはどうなるのか
Investigating Writing Professionals' Relationships with Generative AI: How Combined Perceptions of Rivalry and Collaboration Shape Work Practices and Outcomes
この研究は、プロフェッショナルライターが生成人工知能 (GenAI) との複雑な関係がどのように彼らの仕事の姿と結果を形作るかについて調査しています。様々な役割の専門ライター(n=403)に対する横断部調査を通じて、彼らの仕事に関する違いは関係性の作り込み、スキル維持に rivalry への反応が関わっており、一方で協力心はタスク構築、生産性だけでなく満足度と長期的なスキル低下をも引き起こしていま...
Original: arXiv:2602.08227v1 Announce Type: cross Abstract: This study investigates how professional writers' complex relationship with GenAI shapes their work practices and outcomes. Through a cross-sectional...
Tutti: ユニバーサルフレームワークによる構造化多声生成と歌唱素材モデルを用いた表現豊かな複数歌者合成
Tutti: Expressive Multi-Singer Synthesis via Structure-Level Timbre Control and Vocal Texture Modeling
現在の音楽的な声の合成システムは、多くのソロパフォーマンスに高品質なフィードバックを提供していますが、全体的なテンメリコントロールに制約され、単一の曲内で多声構造と歌い方に加えて静観を捉えることはできません。これを解決するため、統合フレームワークとしてTuttiを提案しました。特に、楽曲の構造に対して柔軟な歌手スケジューリングを可能にするStucture-Aware Singer Promptを導...
Original: arXiv:2602.08233v1 Announce Type: cross Abstract: While existing Singing Voice Synthesis systems achieve high-fidelity solo performances, they are constrained by global timbre control, failing to add...
非想定の有害行動:無視できないシリアスな事後影響を開示するための対話的フレームワークロケーション
When Benign Inputs Lead to Severe Harms: Eliciting Unsafe Unintended Behaviors of Computer-Use Agents
コンピュータ使用アгент(CUA)は、新しいオペレーティングシステム(workflow)を自動化する際には、重要な可能性を持っています。しかし、CUAが意図しない行動を示すことがあります。この動作は、非疑の余地のない状況の単純な入力条件では発生せず、それが非常に有害であると示す場合です。問題は、詳細な定式化や自動的手段を開発することが依然として稀であることにあります。それにより、このような問題を...
Original: arXiv:2602.08235v1 Announce Type: cross Abstract: Although computer-use agents (CUAs) hold significant potential to automate increasingly complex OS workflows, they can demonstrate unsafe unintended ...