2031 articles
自然スタイルトリガーに基づく LLM に対する静かなバックドア攻撃
Stealthy Backdoor Attacks against LLMs Based on Natural Style Triggers
arXiv:2604.21700v1 Announce Type: cross 要約:大規模言語モデル(LLM)が安全関連分野での応用が増えるにつれて、そのセキュリティに関する懸念が高まっています。近年の研究では、LLM に対するバックドア攻撃の実現可能性が示されています。しかし、既存の方法には以下の 3 つの主要な欠点があります:自然さを損なう明示的なトリガーパターン、長文生成における攻撃者が指...
Original: arXiv:2604.21700v1 Announce Type: cross Abstract: The growing application of large language models (LLMs) in safety-critical domains has raised urgent concerns about their security. Many recent studi...
幾何単項式 (GEM): ライナライザー的な性能で純粋な有理数算術に基づく C^{2N}級滑らかなアクティベーション関数の一族
Geometric Monomial (GEM): a family of rational 2N-differentiable activation functions
arXiv:2604.21677v1 Announce Type: cross 要約:アクティベーション関数の選択は、ディープニューラルネットワークの最適化とパフォーマンスに決定的な役割を果たす。Rectified Linear Unit (ReLU) は、その単純さと効果から支配的地位にあるが、その滑らかさの欠如はディープアーキテクチャにおける勾配ベースの最適化を阻害する可能性がある。本研究では...
Original: arXiv:2604.21677v1 Announce Type: cross Abstract: The choice of activation function plays a crucial role in the optimization and performance of deep neural networks. While the Rectified Linear Unit (...
ミクロな視点のモデル化:注釈者固有の根拠に基づく説明の構築
Fine-Grained Perspectives: Modeling Explanations with Annotator-Specific Rationales
arXiv:2604.21667v1 発表タイプ:クロス 要旨:分散ラベルを用いて視点のモデル化を調査するに留まらず、注釈者の根拠は個々の視点に関する微細なシグナルを提供する。本稿では、注釈者が提供する根拠を用いた微调(fine-tuning)を施して、注釈者固有のラベル予測と対応する説明を連成的にモデル化するためのフレームワークを提案する。分散された自然言語推論(NLI)注釈と注釈者が提供する説...
Original: arXiv:2604.21667v1 Announce Type: cross Abstract: Beyond exploring disaggregated labels for modeling perspectives, annotator rationales provide fine-grained signals of individual perspectives. In thi...
Dilated CNNs による周期性信号処理:低複雑性アプローチ
Dilated CNNs for Periodic Signal Processing: A Low-Complexity Approach
arXiv:2604.21651v1 Announce Type: cross 摘れ:周期性信号の去ノイズと波形の正確な推定は、音声、音楽、医学診断、無線、ソナーを含む多くの信号処理分野で核心となるタスクです。最近、ディープラーニング手法は古典的な手法よりも性能向上を示しましたが、それには計算資源の多大な消費が必要であり、通常、各信号観測ごとに別々に学習を行います。本研究では、DCNN とリサンプ...
Original: arXiv:2604.21651v1 Announce Type: cross Abstract: Denoising of periodic signals and accurate waveform estimation are core tasks across many signal processing domains, including speech, music, medical...
自律型水中航行におけるタスク特化型サブネットワーク発見の強化学習アプローチ
Task-specific Subnetwork Discovery in Reinforcement Learning for Autonomous Underwater Navigation
arXiv:2604.21640v1 Announce Type: cross アブストラクト:自律型水中車(AUV)は、動的かつ不確実な条件、限られた感知条件下で、従来のコントローラーが対応に苦労する複数のタスクを適応的かつ可視化された形で実行する必要があり、これに対応する堅牢で一般化でき、本質的に解釈可能な制御ポリシーが、信頼性の高い長期監視において求められています。特にマルチタスク強化学習(...
Original: arXiv:2604.21640v1 Announce Type: cross Abstract: Autonomous underwater vehicles are required to perform multiple tasks adaptively and in an explainable manner under dynamic, uncertain conditions and...
簡素なエージェントの促進:イベントログ予測のためのアンサンブル方法
Promoting Simple Agents: Ensemble Methods for Event-Log Prediction
arXiv:2604.21629v1 Announce Type: cross 要旨:本稿では、ストリーミングイベントログにおける次のアクティビティ予測のために、軽量自機状モデル(n-グラム)をニューラルアーキテクチャ(LSTM、Transformer)と比較します。合成パターンおよび 5 つの現実世界のプロセスマイニングデータセットにおける実験から、適切なコンテキストウィンドウを持つ n-グラ...
Original: arXiv:2604.21629v1 Announce Type: cross Abstract: We compare lightweight automata-based models (n-grams) with neural architectures (LSTM, Transformer) for next-activity prediction in streaming event ...
言語による批評を通じたプロセス監視が大型言語モデルの推論を改善する
Process Supervision via Verbal Critique Improves Reasoning in Large Language Models
arXiv:2604.21611v1 Announce Type: cross 要約: 大型言語モデル(LLM)の推論時の推論スケーリングは、チェーン深度、サンプルの広がり、および学習されたステップスコアラー(PRM)の三つの軸に焦点を当ててきました。私たちは、より強い監視者からの構造化された自然言語批評を利用して、生成−批評−精緻化の反復ループを最大 R 回まで誘導する、勾配更新なしのトレーニン...
Original: arXiv:2604.21611v1 Announce Type: cross Abstract: Inference-time scaling for LLM reasoning has focused on three axes: chain depth, sample breadth, and learned step-scorers (PRMs). We introduce a four...
ASP(Q) を用いた不一致な優先データのパラメータ処理
Using ASP(Q) to Handle Inconsistent Prioritized Data
arXiv:2604.21603v1 発表型:cross 要旨:我々は、優先データの不一致に耐性を備えたクエリに対して、述語を拡張したアンスウェア・プログラム (ASP) と、それが用いる 3 つの最適修復(パーレオ、グローバル、コンプリューム最適)の定義における優先関係の活用を考察している。AR、勇敢(brave)、IAR という 3 つの広く知られた семантик 変種を考証し、それらは ...
Original: arXiv:2604.21603v1 Announce Type: cross Abstract: We explore the use of answer set programming (ASP) and its extension with quantifiers, ASP(Q), for inconsistency-tolerant querying of prioritized dat...
画像分類における事前処理とメモリストルダイナミクスが蓄積計算における役割
On the Role of Preprocessing and Memristor Dynamics in Reservoir Computing for Image Classification
arXiv:2604.21602v1 Announce Type: cross 摘要:蓄積計算(RC)は、学習コストの低さとハードウェア要件の小ささにより、注目を集める新興の再帰型ニューラルネットワークアーキテクチャです。特に、その内在的なダイナミクスが時間シリープリダクションや画像認識などのタスクにおいてネットワークサイズやパラメータオーバーヘッドを削減できるため、メモリストルベースの回路は R...
Original: arXiv:2604.21602v1 Announce Type: cross Abstract: Reservoir computing (RC) is an emerging recurrent neural network architecture that has attracted growing attention for its low training cost and mode...
DryRUN: LLM 駆動型コード生成における公共テストの役割について
DryRUN: On the Role of Public Tests in LLM-Driven Code Generation
arXiv:2604.21598v1 Announce Type: cross Abstract: マルチエージェントフレームワークは、自律型コード生成および複雑なアルゴリズム問題解決に広く利用されています。最近の取り組みでは、言語モデルが実行ステップをトレースしてロジックを検証するよう、シミュレーション駆動型のプランニングとデバッグを組み込むことで、機能的に正しいコードの生成という課題に対処...
Original: arXiv:2604.21598v1 Announce Type: cross Abstract: Multi-agent frameworks are widely used in autonomous code generation and have applications in complex algorithmic problem-solving. Recent work has ad...
LLM ベースのプログラム修復における暗記の診断:メタモーフィック・テストと負の対数尤度値を組み合わせたアプローチ
A Metamorphic Testing Approach to Diagnosing Memorization in LLM-Based Program Repair
arXiv:2604.21579v1 Announce Type: cross 要旨: LLM(大規模言語モデル)ベースの自動プログラム修復(APR)技術は、デバッグコストを削減する有望な結果を示しています。しかし、従来の結果はデータリークの影響を受け得ます。LLM は評価ベンチマークが事前学習データと重複している場合、バグ修正を暗記(暗記)することがあり、性能評価が膨らんでしまうからです。本論文...
Original: arXiv:2604.21579v1 Announce Type: cross Abstract: LLM-based automated program repair (APR) techniques have shown promising results in reducing debugging costs. However, prior results can be affected ...
結合された需要予測とサプライチェーン最適化のためのハイブリッドディープラーニングアプローチ
Hybrid Deep Learning Approach for Coupled Demand Forecasting and Supply Chain Optimization
arXiv:2604.21567v1 Announce Type: cross 要約: 変動する需要と不確実な供給が特徴である、テキストファイバーや個人防護具(PPE)などの業界において、サプライチェーンの強靭性と効率性が不可欠です。従来の予測と最適化アプローチはしばしば個別に操作され、実世界での効果に限界を置かれています。この論文では、Long Short-Term Memory (LSTM)...
Original: arXiv:2604.21567v1 Announce Type: cross Abstract: Supply chain resilience and efficiency are vital in industries characterized by volatile demand and uncertain supply, such as textiles and personal p...
事前学習済み大規模言語モデルと順序推測器の融合:リアルタイムでの効率的なユーザー中心知識蒸留
Pre-trained LLMs Meet Sequential Recommenders: Efficient User-Centric Knowledge Distillation
arXiv:2604.21536v1 Announce Type: cross 要約:順序推測システムは、ユーザーの時間的行動モデリングにおいて大きな成功を収めましたが、相互作用のパターンを超えた豊富なユーザーの意味(semantic)を捉えるにはまだ限られています。大規模言語モデル(LLM)には、その論理推論能力を通じてユーザー理解を強化する機会がありますが、既存の統合アプローチはリアルタイム...
Original: arXiv:2604.21536v1 Announce Type: cross Abstract: Sequential recommender systems have achieved significant success in modeling temporal user behavior but remain limited in capturing rich user semanti...
情報と制御制約下における堅牢な自己組織化エネルギーシステムのためのアーキテクチャ
Architectures for Robust Self-Organizing Energy Systems under Information and Control Constraints
arXiv:2604.21529v1 Announce Type: cross 本稿は、エージェントベースのサイバー物理エネルギーシステム(CPES)における制御された自己組織化の概念を適用することで、システムの堅牢性を確保するための有望なアプローチを示す。システムに観測器/コントローラーアーキテクチャを導入することで、自己組織化が可能となり、かつ摂動が発生したときに介入を可能にする。したがって...
Original: arXiv:2604.21529v1 Announce Type: cross Abstract: Applying the concept of controlled self-organization in agent-based Cyber-Physical Energy Systems (CPES) is a promising approach to ensure system rob...
Operation Sketches と自己学習によるテーブルデータにおける数値推論の一般化
Generalizing Numerical Reasoning in Table Data through Operation Sketches and Self-Supervised Learning
arXiv:2604.21495v1 Announce Type: cross 要約:専門家ドメインのテーブル上で数値推論を行うモデルは、ドメイン内での高い精度を示すが、ドメインシフトに対する強さは限られている。特定のデータセットで監督学習微調整(SFT)を受けたモデルは、構造的な推論よりもヘッダーと操作に関する短絡的なテクニックに依存する傾向がある。本研究では、継続的な事前学習フレームワークで...
Original: arXiv:2604.21495v1 Announce Type: cross Abstract: Numerical reasoning over expert-domain tables often exhibits high in-domain accuracy but limited robustness to domain shift. Models trained with supe...
MISTY: Mixer に基づくワンステップドリフトによる高スループット動計画
MISTY: High-Throughput Motion Planning via Mixer-based Single-step Drifting
arXiv:2604.21489v1 Announce Type: cross 要旨:マルチモーダル軌道生成は安全な自律走行に不可欠ですが、既存の拡散モデルに基づくプランナーは反復的なニューラル関数評価により推論遅延が高くなります。本稿では、純粋なワンステップ推論により最優先のクローズドループ性能を実現する、高スループット生成動計画器 MISTY(Mixer-based Inference fo...
Original: arXiv:2604.21489v1 Announce Type: cross Abstract: Multi-modal trajectory generation is essential for safe autonomous driving, yet existing diffusion-based planners suffer from high inference latency ...
残差グラフ同型ネットワークと注意力機構による薬剤シネルジー予測
Drug Synergy Prediction via Residual Graph Isomorphism Networks and Attention Mechanisms
arXiv:2604.21473v1 Announce Type: cross 要旨:複雑な疾患の治療において、単一薬剤を用いた治療プロトコルは限界のある効果をしか示さず、薬剤耐性を引き起こす可能性があります。それに対し、結合薬物療法は相乗効果を通じて治療結果を大幅に改善できます。しかし、実験的にすべての可能な薬剤組み合わせを検証することは著しく高コストであるため、効率的な計算予測法の必要性が際立...
Original: arXiv:2604.21473v1 Announce Type: cross Abstract: In the treatment of complex diseases, treatment regimens using a single drug often yield limited efficacy and can lead to drug resistance. In contras...
動的な事前知識を強化学習における訓練目的とすること
Dynamical Priors as a Training Objective in Reinforcement Learning
arXiv:2604.21464v1 Announce Type: cross 要約:標準的な強化学習(RL)は報酬を最適化するものの、決定の時間発展に関する制限は少なく、時間的不整合な行動(突然の確信の変化、振動、あるいは退化的な不活動など)を示しつつ高い性能を得る可能性があります。我々は、証拠蓄積とヒステリシスを実装する外部状態の動的性質から導かれた補助損失を加えることで、政策勾配学習を拡張...
Original: arXiv:2604.21464v1 Announce Type: cross Abstract: Standard reinforcement learning (RL) optimizes policies for reward but imposes few constraints on how decisions evolve over time. As a result, polici...
Hybrid と Non-Hybrid LLM における論理推理の素素
Reasoning Primitives in Hybrid and Non-Hybrid LLMs
arXiv:2604.21454v1 発表タイプ:クロス 要旨:大型言語モデル(LLM)における論理推理は通常、単一的能力として扱われていますが、その観察される効果はより基本的な操作に起因している可能性があります。われわれは、回想(recall)とステート・トラック(state-tracking)という 2 つのそのような素(primitive)を通じて論理推理を研究し、アテンションベースのリtr...
Original: arXiv:2604.21454v1 Announce Type: cross Abstract: Reasoning in large language models is often treated as a monolithic capability, but its observed gains may arise from more basic operations. We study...
オランダ語臨床ノートにおける差分プライバシーベースの匿名化:比較評価
Differentially Private De-identification of Dutch Clinical Notes: A Comparative Evaluation
論文:arXiv:2604.21421v1 発表種別:Cross 要旨: 臨床ナラティブにおける患者プライバシーの保護は、GDPR や HIPAA などの規制下で医療データの二次利用を可能にするために不可欠である。手動による匿名化はゴールドスタンダードであるにもかかわらず、コストが高く時間がかかっているため、差分プライバシー(differential privacy / DP)の保証と高い実用性...
Original: arXiv:2604.21421v1 Announce Type: cross Abstract: Protecting patient privacy in clinical narratives is essential for enabling secondary use of healthcare data under regulations such as GDPR and HIPAA...