2031 articles
暗号学支援のサイバー脅威知る情报の vulnerabilities を解き明かす
Uncovering Vulnerabilities of LLM-Assisted Cyber Threat Intelligence
大規模言語モデル(LLMs)がセキュリティアナリストにカyやくしてサイバー脅威を管理するための浪人であるようになり、脆弱性評価から事態応答までさまざまなタスクが自動化されるようになりました。しかし、実務的なCTIワークフローでは信頼性のギャップは依然として大きくあります。 現在の説明は一般的な模型問題(例えば、幻覚)に焦点を当てていますが、我々は普遍的バリアンスが主要なボトルネックであると考えてい...
Original: arXiv:2509.23573v3 Announce Type: replace-cross Abstract: Large language models (LLMs) are increasingly used to help security analysts manage the surge of cyber threats, automating tasks from vulnera...
Diffusion 文字を声に変換するテクノロジーは、好みに基づいての最適化により感情対応生成を利用
Emotion-Aligned Generation in Diffusion Text to Speech Models via Preference-Guided Optimization
Original: arXiv:2509.25416v2 Announce Type: replace-cross Abstract: Emotional text-to-speech seeks to convey affect while preserving intelligibility and prosody, yet existing methods rely on coarse labels or p...
コピー&ペーストを用いて大規模言語モデルの錯覚を軽減する
Copy-Paste to Mitigate Large Language Model Hallucinations
Retrieval-Augmented Generation (RAG)により、large language model(LLM)は文脈に適忈した回答が生成できるようになりました。しかし、LLMは提供された文脈に常に信頼していないため、文脈に従った誤りを生じさせ、信頼性を損なうことになります。RAGTruth上での回答のコピー度と文脈ずれした誤りとの逆関連性を通観し、より高いコピー度は誤りの減少に...
Original: arXiv:2510.00508v2 Announce Type: replace-cross Abstract: While Retrieval-Augmented Generation (RAG) enables large language models (LLMs) to generate contextually grounded responses, contextual faith...
言語情報処理の開放的な探orの方向性:低リソースNLP
Towards Open-Ended Discovery for Low-Resource NLP
自然言語処理(NLP)は、対象言語が不足している言語に対しても,事実上の資源に制約を受け続けています。このため、文書データや規格化された記号体系の欠如とスケール可能な件出管財パイプラインが関連する点からです。最近の大規模な言語モデルによる技術的な開発は多国語への統合転送を改善しましたが、過疎コミュニティのために彼らが必要としている大人数の、前から集められたデータに大きく依存しているため完全にアクセ...
Original: arXiv:2510.01220v2 Announce Type: replace-cross Abstract: Natural Language Processing (NLP) for low-resource languages remains fundamentally constrained by the lack of textual corpora, standardized o...
瞬間の取引!理性に基づいた代理システムによる量的金融取引
Trade in Minutes! Rationality-Driven Agentic System for Quantitative Financial Trading
近い将来、大規模言語モデル(LLM)と代理システムへの大きな進歩は、尤もな意思決定機能を示し、自動的な金融市場に対して潜在的に非常に大きな価値を持つことが明らかになった。現在の主な財務取引代理では、感情的バイアスによる誤りが発生しやすい人間特有の役割を想定し、周辺情報をもとに利用した結果、デポジアウトに制約された連続的な推論により依存しています。この論文では、代理人にとってストラテジーが必要となる...
Original: arXiv:2510.04787v2 Announce Type: replace-cross Abstract: Recent advancements in large language models (LLMs) and agentic systems have shown exceptional decision-making capabilities, revealing signif...
深層生成モデルによる人間のmobility動作を理解とモデリング
Deep Generative Model for Human Mobility Behavior
Original: arXiv:2510.06473v2 Announce Type: replace-cross Abstract: Understanding and modeling human mobility is central to challenges in transport planning, sustainable urban design, and public health. Despit...
CoMAS: 自動的に学び合うマルチエージェントシステムによる相互の報酬ベースの適性修復
CoMAS: Co-Evolving Multi-Agent Systems via Interaction Rewards
Original: arXiv:2510.08529v2 Announce Type: replace-cross Abstract: Self-evolution is a central research topic in enabling large language model (LLM)-based agents to continually improve their capabilities afte...
SHERLOCK:LLM増強済みECリスク管理におけるダイナミック知識適合化に向けた
SHERLOCK:Towards Dynamic Knowledge Adaptation in LLM-enhanced E-commerce Risk Management
高度な攻撃状態での広範多様なデータの連携と結びつきを検討する伝統的な手作業的調査は労力を要し、効率性を制限します。大規模言語モデル(LLM)がこれらの分析を自動化する可能性があることを示わす一方、リスクシナリオの複雑さと深い専門知識の希少性からデプロイメントは困難です。これら2つの課題に対処するため、我々はSherlockという包括的なフレームワークを開発しました。これは構造化された分野での知恵を...
Original: arXiv:2510.08948v3 Announce Type: replace-cross Abstract: Effective e-commerce risk management requires in-depth case investigations to identify emerging fraud patterns in highly adversarial environm...
Diffusion Inspired マスクインターナショナルチューニングによる知識の投入: アウトローサティブLLMにとって
Diffusion-Inspired Masked Fine-Tuning for Knowledge Injection in Autoregressive LLMs
大型言語モデル (LLMs) の多くは、事実が変わる環境で使用できます。一方で、未構造テキストへの微調整による事実に関する知識を更新することは、パワフルなシナリオ変換や逆流カウンドから利益を受けることによって苦労しています。最近の研究によると、dLLM (Diffusion-inspired LLM) は、プレトレーニングでの損失が低いことを要求するわずかなトレーナーのサンプル数を求めているため、...
Original: arXiv:2510.09885v4 Announce Type: replace-cross Abstract: Large language models (LLMs) are often used in environments where facts evolve, yet factual knowledge updates via fine-tuning on unstructured...
何層をスキップする:LLMsにResidualゲートを学ぶ
What Layers When: Learning to Skip Compute in LLMs with Residual Gates
arXiv:2510.13876v3 の種類: 代用-交叉関連 抄録:我々はGateSkipを提示することになります、これはデコーダー専用のLLM(ロングフォーム)にトークン単位で層をスキップさせる、単純な残余ストリームゲート機構です。各Attention/MLPブランチには、サインoid- linea化ゲートが装備されており、このブランチのアウトプットを再参加前に強調します。展開時の実践では、こ...
Original: arXiv:2510.13876v3 Announce Type: replace-cross Abstract: We introduce GateSkip, a simple residual-stream gating mechanism that enables token-wise layer skipping in decoder-only LMs. Each Attention/M...
Reasoning Lingua Franca: Multilinguismeの両面剣としてのAIの問題
The Reasoning Lingua Franca: A Double-Edged Sword for Multilingual AI
Large Reasoning Models (LRMs)が数学、科学など、他にも質問応答タスクで強力なパフォーマンスを達成しています。しかし、多言語論理能力についてはまだ十分に探索されていません。非英語の文面に出くわしたとき、LRMsは英語で論理を進めがちであり、解釈性や、文化と言語のニュアンスへの対応力を懸念する問題点があります。我々はLRMの英語での論理性に対して、文中の言語に基づいた論理性...
Original: arXiv:2510.20647v3 Announce Type: replace-cross Abstract: Large Reasoning Models (LRMs) achieve strong performance on mathematical, scientific, and other question-answering tasks, but their multiling...
BudgetMem:言語モデルの長期文脈処理におけるコスト効率的なメモリ管理戦略の学習
BudgetMem: Learning Selective Memory Policies for Cost-Efficient Long-Context Processing in Language Models
大規模言語モデル (LLMs) は、長い文脈を処理する際に膨大的な計算とメモリ制約に直面しています。また、要件が高いものが存在します:理由を複数の文書や、多_SESSION のディスカッション、長い本のような文章において解釱することがあります。最近での進歩は、context 窓口を 100,000-1,000,000トークンに延長するまでと続きましたが、制約のある出力を実装するためにそれらのアプロ...
Original: arXiv:2511.04919v2 Announce Type: replace-cross Abstract: Large Language Models (LLMs) face significant computational and memory constraints when processing long contexts, despite growing demand for ...
IDALC: スemi-supervised フレームワークによる意図の検出とアクティブ学習に基づいた修正
IDALC: A Semi-Supervised Framework for Intent Detection and Active Learning based Correction
音声制御の会話システムは、異なるユーザ質問に対する広範な行動を行うことで大変人気があります。これらの代理人は特定のユーザタスクで使用できる予め定義されたスキルや意図セットを持っています。けれども、全てのシステムには限界があるのです。知られざる意図の場合でも、モデルが低な確信を示した場合は発言は無効化され、それに伴う手動の記番作業が必要になることがあります。また時間とともにこれらに接続する新たなタス...
Original: arXiv:2511.05921v2 Announce Type: replace-cross Abstract: Voice-controlled dialog systems have become immensely popular due to their ability to perform a wide range of actions in response to diverse ...
MTR-DuplexBench: Full-Duplex会話言語モデルの完全評価を Towards もう一つの多回転動態を持つユーザー体験
MTR-DuplexBench: Towards a Comprehensive Evaluation of Multi-Round Conversations for Full-Duplex Speech Language Models
フルドッピング言語モデル(FD-SLMs)は、リアルタイムな並行的な会話を可能にし、単純な半ドッピングモデルが提供するよりダイナミックで興奮するユーザー経験を提供します。しかし、これまでの評価基準は、主には一回転だけの会話の評価に重点を置いています。それは多回転のコミュニケーションについての複雑さを無視しています。また、既存の評価基準では、通常の会話に関する特性のみを評価し解釈することが多いので、...
Original: arXiv:2511.10262v2 Announce Type: replace-cross Abstract: Full-Duplex Speech Language Models (FD-SLMs) enable real-time, overlapping conversational interactions, offering a more dynamic user experien...
SoK: LLM代理アゲント間の信頼-許可不一致
SoK: Trust-Authorization Mismatch in LLM Agent Interactions
Large Language Models (LLMs)は、標準的なプロトコル(例:MCP)を介して複雑なワークフローを実行する自律型アゲントとして進化しています。しかし、これにより、決定論的コードから確率推理の分離によって信頼と許可が不一致しているための「信頼 - 許可 Mismatch」が生じるようになっています。この本質的なトレーサビリティを考慮に入れたシステム化の知識(SoK)では、200...
Original: arXiv:2512.06914v2 Announce Type: replace-cross Abstract: Large Language Models (LLMs) are evolving into autonomous agents capable of executing complex workflows via standardized protocols (e.g., MCP...
会話での感情理解:認識の洞察と言語パターンを用いた生成
Understanding Emotion in Discourse: Recognition Insights and Linguistic Patterns for Generation
Despite recent strong进展 in Emotion Recognition in Conversation (ERC),仍有两个不足之处:缺乏明确定义的选择决定了表现,我们对识别发现与可操作的生成线索之间的链接有限的语义分析。这些问题通过在IEMOCAP上进行全面的研究来解决。对于识别方面,我们进行的是受控替代实验并使用10个随机种子及成对测试(多比较后调整),产生了三个发现。首...
Original: arXiv:2601.00181v2 Announce Type: replace-cross Abstract: Despite strong recent progress in Emotion Recognition in Conversation (ERC), two gaps remain: we lack clear understanding of which modeling c...
refutability gap: ラングーージャン変換の理由を認めるための挑戦
The Refutability Gap: Challenges in Validating Reasoning by Large Language Models
リレートビーナスギャップ(ここでは「refutability gap」という表現を使用します)は、非常に多大な言語モデルが新しい科学を導出し、一般的人間レベルの一般的な知能を持つ能力があるという報告に対して問題を引き起こしています。彼らがポッパーの可否性原理(Term: falsifiability)を必要としないためです。この原理(あるいは可否性)は、科学的な主張が否定可能であることを要求します...
Original: arXiv:2601.02380v2 Announce Type: replace-cross Abstract: Recent reports claim that Large Language Models (LLMs) have achieved the ability to derive new science and exhibit human-level general intell...
大規模言語モデルのシンティクスとセマンチックス理解:給与システムにおけるライフゲームアプローチ
Evaluating Semantic and Syntactic Understanding in Large Language Models for Payroll Systems
現在、大規模な言語モデルは日常的に書くことや検索したり分析したりするのに使用されています。また、このモデルの自然言語理解も徐々に改善されることになりますが、モデルは数値計算や直感的に確認できるような出力を生成することはまだ不安定であるとされます。我々は、財務システムというシナリオをクローズアップさせた重要で高リスクなケースとして選び出し、大規模言語モデルが給与の構造的理解をすることが可能なのか、規...
Original: arXiv:2601.18012v2 Announce Type: replace-cross Abstract: Large language models are now used daily for writing, search, and analysis, and their natural language understanding continues to improve. Ho...
UI生成におけるUIデザインの意思疎通を補完するためのsemantican推奨
Bridging Gulfs in UI Generation through Semantic Guidance
高品位なUI生成を文字によるpromptから実現させる generative AI が存在します。しかしユーザーたちは、設計の意図と評価・修正結果に詰まりがあります。そのため、 UI の生成のために必要な情報について、UIの生成ガイドラインを議論し、重要なデザインセマンティクを見つけることにテーマ分析が使われました。それにより、設計のセマンティックは階層的で相互に関連しておりました。これは、ユーザ...
Original: arXiv:2601.19171v2 Announce Type: replace-cross Abstract: While generative AI enables high-fidelity UI generation from text prompts, users struggle to articulate design intent and evaluate or refine ...
ビデオストーリィング: 問題を解決する拡張的なビジュアル・メディアと生成ビデオ
Vidmento: Creating Video Stories Through Context-Aware Expansion With Generative Video
Original: arXiv:2601.22013v2 Announce Type: replace-cross Abstract: Video storytelling is often constrained by available material, limiting creative expression and leaving undesired narrative gaps. Generative ...