2031 articles
二重飽和ラムゼーグラフ:数学発見におけるコンピュータ支援へのケーススタディ
Doubly Saturated Ramsey Graphs: A Case Study in Computer-Assisted Mathematical Discovery
arXiv:2604.21187v1 発表タイプ: cross 要旨:ラムゼー善なるグラフとは、サイズ $s$ のクライクおよびサイズ $t$ の独立集合をどちらも含めないグラフのことである。本稿では、辺の追加または削除が必ずサイズ $s$ のクライクまたはサイズ $t$ の独立集合を生じさせるラムゼー善なるグラフ、すなわち二重飽和ラムゼーグラフを対象とする。我々は、SAT 解法と LLM によ...
Original: arXiv:2604.21187v1 Announce Type: cross Abstract: Ramsey-good graphs are graphs that contain neither a clique of size $s$ nor an independent set of size $t$. We study doubly saturated Ramsey-good gra...
Gaussian Kolmogorov--Arnold ネットワークのスケール拡張
Scaling of Gaussian Kolmogorov--Arnold Networks
arXiv:2604.21174v1 発表タイプ:横断研究 要約:高斯型 Kolmogorov--Arnold ネットワーク (KAN) の動作における高斯スケーリングパラメータ\(\epsilon\) は中心的役割を担っているが、その深層エッジに基づくアーキテクチャにおける役割は体系的に研究されていない。本研究では、1 層の特徴幾何学、条件付け、および近似挙動を通じて、\(\epsilon\) ...
Original: arXiv:2604.21174v1 Announce Type: cross Abstract: The Gaussian scale parameter \(\epsilon\) is central to the behavior of Gaussian Kolmogorov--Arnold Networks (KANs), yet its role in deep edge-based ...
TAPO 記述論による情報行動論:改良された OBoxes、推論、およびカテゴリカル意味論
TAPO-Description Logic for Information Behavior: Refined OBoxes, Inference, and Categorical Semantics
arXiv:2604.21172v1 Announce Type: cross 本論文は、情報行動の分析のために TAPO-記述論の洗練されたバージョンを開発する。このフレームワークは、単一の統合的な対物論としてではなく、静的記述層(TBox/ABox)、手続き的層(PBox)、および御札感度層(OBox)から成る階層的な形式体系として扱う。この架構を数学的に明示するために、手続き的分岐と反復を統...
Original: arXiv:2604.21172v1 Announce Type: cross Abstract: This paper develops a refined version of TAPO-description logic for the analysis of information behavior. The framework is treated not as a single ho...
アダプティブなインストラクションコンポジションを用いた自動 LLM レッドチームイング
Adaptive Instruction Composition for Automated LLM Red-Teaming
arXiv:2604.21159v1 Announce Type: cross Abstract: LLM レッドチームイングの多くは、ターゲットに対してジャイルブレイクを発見するために攻撃者用 LLM を活用しています。いくつかのアプローチは、試行錯誤を通じて効果的な戦略を特定させる攻撃者に業務を委託し、その結果としてセマンティックに制限された成功範囲が生じます。別のアプローチは、 crowds...
Original: arXiv:2604.21159v1 Announce Type: cross Abstract: Many approaches to LLM red-teaming leverage an attacker LLM to discover jailbreaks against a target. Several of them task the attacker with identifyi...
方言と人口統計データ:明示的なユーザープロフィールと暗黙的な言語信号に基づく LLM バイアスの定量分析
Dialect vs Demographics: Quantifying LLM Bias from Implicit Linguistic Signals vs. Explicit User Profiles
arXiv:2604.21152v1 告知タイプ: クロス 要旨: 最先端の大規模言語モデル(LLMs)が普遍的になった現在、多様な人口統計グループにわたって公平なパフォーマンスを担保することが不可欠になっています。しかし、これらの偏差が、明示的に表明されたアイデンティティそのものによるものなのか、それともアイデンティティの提示方法によるものなのかは依然として不明です。現実の対話において、ユーザー...
Original: arXiv:2604.21152v1 Announce Type: cross Abstract: As state-of-the-art Large Language Models (LLMs) have become ubiquitous, ensuring equitable performance across diverse demographics is critical. Howe...
状況対話における共通の前提を表現するためのマインド・メンタル・イメージの利用
Using Machine Mental Imagery for Representing Common Ground in Situated Dialogue
arXiv:2604.21144v1 Announce Type: cross アブストラクト:状況対話では、話者は個別の文だけを対象とした推論ではなく、共有文脈の信頼性の高い表象を維持する必要があります。現在の対話エージェントは、この要件、特に文脈ウィンドウを超えて共通の前提を維持する必要がある場合に、しばしば苦戦します。このような設定では、微細な区別は純粋なテキスト表現に圧縮されることが多く、...
Original: arXiv:2604.21144v1 Announce Type: cross Abstract: Situated dialogue requires speakers to maintain a reliable representation of shared context rather than reasoning only over isolated utterances. Curr...
混雑環境におけるマルチロ봇システムのためのウェーポイントベースの二段階計画
Navigating the Clutter: Waypoint-Based Bi-Level Planning for Multi-Robot Systems
arXiv:2604.21138v1 Announce Type: cross Abstract: 混雑環境におけるマルチロボットの制御は、ロボツト同士の衝突やロボツトと障害物の衝突、到達不能な動作を含む複雑な物理的制約を伴う困難な課題です。このような環境での成功した計画には、高レベルのタスク計画と低レベルの運動計画にわたる共同最適化が必要です。なぜなら、物理的制約の違反がどちらのレベルでの失敗に...
Original: arXiv:2604.21138v1 Announce Type: cross Abstract: Multi-robot control in cluttered environments is a challenging problem that involves complex physical constraints, including robot-robot collisions, ...
教師の発言と生徒の発言の両者を補完的な次元で分類することによる、科学的教室での議論分析を多目的学習で向上させる
Enhancing Science Classroom Discourse Analysis through Joint Multi-Task Learning for Reasoning-Component Classification
arXiv:2604.21137v1 Announce Type: cross 抽象:科学教室における生徒の推論パターンを分析することは、知識の構築メカニズムを理解し、認知関与を最大化する教育実践を改善するために不可欠ですが、大規模な教室での議論の自動编码はまだ手作業で膨大な労働を要するため不可能なほど困難です。 私たちは、CDAT フレームワークから派生した 2 つの補完的な次元である「発言タイ...
Original: arXiv:2604.21137v1 Announce Type: cross Abstract: Analyzing the reasoning patterns of students in science classrooms is critical for understanding knowledge construction mechanism and improving instr...
AI エージェントにおけるクロスセッション脅威:ベンチマーク、評価,およびアルゴリズム
Cross-Session Threats in AI Agents: Benchmark, Evaluation, and Algorithms
arXiv:2604.21131v1 発表 タイプ:クロス 要旨:AI エージェントのガードレールはメモリレス(記憶なし)であり、各メッセージは個別に評価されるため、単一の攻撃を多数のセッションに散布して行う敵は、すべてのセッション境界の検知器を通過してしまう。なぜなら、その集計値のみがペイロードを保持するからである。私たちはクロスセッション脅威検知について 3 つの貢献を提供する。 (1) デー...
Original: arXiv:2604.21131v1 Announce Type: cross Abstract: AI-agent guardrails are memoryless: each message is judged in isolation, so an adversary who spreads a single attack across dozens of sessions slips ...
AGNT2: インタラクション最適化された L2 インフラ上に機能する自律エージェントエコノミー
AGNT2: Autonomous Agent Economies on Interaction-Optimized Layer 2 Infrastructure
arXiv:2604.21129v1 Announce Type: cross Abstract: 現在のブロックチェーンの L2 ソリューション(Optimism, Arbitrum, zkSync など及其もの)は、人間が发起の金融取引を最適化しています。自律的な AI エージェントは、相互に信頼を置かない主体間で、頻度高く、機能的に豊かなサービス呼び出し(インボケーション)を生成します。既存...
Original: arXiv:2604.21129v1 Announce Type: cross Abstract: Current blockchain Layer 2 solutions, including Optimism, Arbitrum, zkSync, and their derivatives, optimize for human-initiated financial transaction...
TRAVELFRAUDBENCH: GNN による旅行ネットワーク上の不正団体検出への構成可能な評価フレームワーク
TRAVELFRAUDBENCH: A Configurable Evaluation Framework for GNN Fraud Ring Detection in Travel Networks
arXiv:2604.21093v1 Announce Type: cross 要約: 私たちは、旅行プラットフォームグラフにおける不正団体検出に GNN (Graph Neural Networks) を評価するための構成可能なベンチマークである TravelFraudBench (TFG) を導入しました。既存のベンチマーク(YelpChi, Amazon-Fraud, Elliptic, ...
Original: arXiv:2604.21093v1 Announce Type: cross Abstract: We introduce TravelFraudBench (TFG), a configurable benchmark for evaluating graph neural networks (GNNs) on fraud ring detection in travel platform ...
実践者の AI ガバナンスプロンプトにおける構造的欠陥:5 つの原理に基づく評価枠組みを用いた実証研究
Structural Quality Gaps in Practitioner AI Governance Prompts: An Empirical Study Using a Five-Principle Evaluation Framework
arXiv:2604.21090v1 Announce Type: cross 摘要: AI ガバナンスプログラムは、自然言語プロンプトを介して AI エージェントの挙動を制約し方向付けるよう、ますます依存しています。これらのプロンプトは実行可能な仕様として機能し、エージェントの委任、範囲、および品質基準を定義します。にもかかわらず、ガバナンスプロンプトが構造的に完全かどうかを評価する体系的な枠...
Original: arXiv:2604.21090v1 Announce Type: cross Abstract: AI governance programmes increasingly rely on natural language prompts to constrain and direct AI agent behaviour. These prompts function as executab...
大規模言語モデル API ゲートウェイにおける行動の整合性と透明性の分析
Behavioral Consistency and Transparency Analysis on Large Language Model API Gateways
arXiv:2604.21083v1 Announce Type: cross 摘要: サードパーティ製の大規模言語モデル(LLM)API ゲートウェイは、複数のベンダーが提供するモデルへの統一されたアクセスポイントとして急速に登場しています。しかし、これらのゲートウェイの内部ルータ、キャッシュ、請求ポリシーは広く開示されておらず、ユーザーは要請が広告されたモデルによって処理されているか、応答がア...
Original: arXiv:2604.21083v1 Announce Type: cross Abstract: Third-party Large Language Model (LLM) API gateways are rapidly emerging as unified access points to models offered by multiple vendors. However, the...
シリアル化戦略が重要: FHIR データフォーマットが LLM 処方調和をどのように影響するか
Serialisation Strategy Matters: How FHIR Data Format Affects LLM Medication Reconciliation
arXiv:2604.21076v1 Announce Type: cross 要約: 臨床的な転換点における処方の調和は、高いリスクを伴うかつ誤りの多いプロセスです。大規模言語モデル(LLM)は、FHIR 構造化患者記録を使用するこのタスクを支援するための方法としてますます提案されていますが、モデルへ渡す前に FHIR データがどのようにシリアル化されるかが、基本的でありかつほとんど研究されてい...
Original: arXiv:2604.21076v1 Announce Type: cross Abstract: Medication reconciliation at clinical handoffs is a high-stakes, error-prone process. Large language models are increasingly proposed to assist with ...
競合する物理的制約条件下における磁気絶縁体に関する生成型発見
Generative Discovery of Magnetic Insulators under Competing Physical Constraints
arXiv:2604.21073v1 発表タイプ: クロス 要旨:複数の競合する制約を同時に満たす必要がある素材の発見は、計算材料設計における中心的な課題であり、特に従来のデータ駆動アプローチが最も効果的でないデータ不足の環境では特に顕著です。磁気絶縁体は厳格な例を示すものであり、磁気並ぶのを好む電子的条件は通常、金属性を促進する一方、絶縁動作は磁気を安定化させる相互作用を抑制します。その結果、実...
Original: arXiv:2604.21073v1 Announce Type: cross Abstract: Discovering materials that must simultaneously satisfy multiple competing constraints remains a central challenge in computational materials design, ...
物理学検証に基づく生成推理によって極電界材の領域を拡張する
Expanding the extreme-k dielectric materials space through physics-validated generative reasoning
arXiv:2604.21068v1 Announce Type: cross 摘要:最も技術的に重要な材料はしばしば最も希少なものです:それらは化学空間の狭い領域に位置し、互いに競う物理的制約に従い、既存のデータベースでは稀にのみ出現します。κ (クッパ) 値が高い誘電体、高臨界温度超伝導体、および磁気的絶縁体などはその一例です。この希少性こそが、現在、機械学習モデルが補間には得意ですが真に新し...
Original: arXiv:2604.21068v1 Announce Type: cross Abstract: The most technologically consequential materials are often the rarest: they occupy narrow regions of chemical space, obey competing physical constrai...
AI 議論における戦略的曖昧性:言語、ハイク、そして権力についての哲学的分析
Strategic Polysemy in AI Discourse: A Philosophical Analysis of Language, Hype, and Power
arXiv:2604.21043v1 Announce Type: cross 本稿では、現代的人工知能 (AI) 議論における言語の戦略的利用を検討します。具体的には、「ハルシネーション(幻覚)」、「Chain-of-thought(思考の連鎖)」、「introspection(内省)」、「language model(言語モデル)」、「alignment(対齐)」、「agent(エージェント)...
Original: arXiv:2604.21043v1 Announce Type: cross Abstract: This paper examines the strategic use of language in contemporary artificial intelligence (AI) discourse, focusing on the widespread adoption of meta...
教育分野における合成データ:従来型再サンプリングとディープ・ジェネレーティブ・モデルからの実証的知見
Synthetic Data in Education: Empirical Insights from Traditional Resampling and Deep Generative Models
arXiv:2604.21031v1 Announce Type: cross Abstract: 合成データの生成は、教育技術におけるデータ不足とプライバシー懸念に対処する可能性をもたらしていますが、実務者は伝統的な再サンプリング手法と現代のディープラーニング手法の間の選択を行うための実証的ガイダンスが不足しています。本研究では、10,000 件の生徒成績データセットを用いて、これらパラダイムを...
Original: arXiv:2604.21031v1 Announce Type: cross Abstract: Synthetic data generation offers promise for addressing data scarcity and privacy concerns in educational technology, yet practitioners lack empirica...
線形系に対する強化学習とモデル予言制御の統合:体系的レビューと分類法
A Systematic Review and Taxonomy of Reinforcement Learning-Model Predictive Control Integration for Linear Systems
arXiv:2604.21030v1 Announce Type: cross 摘記: モデル予言制御(MPC)と強化学習(RL)の統合は、制約付き意思決定と適応制御のために有望なパラダイムとして台頭してきた。MPC は構造化された最適化、明示的な制約処理、確立された安定性ツールを提供する一方、RL は不確実性とモデル不整合が存在する環境でのデータ駆動型適応と性能向上を提供する。RL--MPC ...
Original: arXiv:2604.21030v1 Announce Type: cross Abstract: The integration of Model Predictive Control (MPC) and Reinforcement Learning (RL) has emerged as a promising paradigm for constrained decision-making...
個別化製造の統合パッキング・配置・スケジューリング・ルーティング:平面輸送システムを用いたファーマцевティカ業界の「インダストリー 4.0」事例
Integrated packing, placement, scheduling, and routing of personalized production: a pharmaceutical Industry 4.0 use-case with a planar transport system
arXiv:2604.21029v1 Announce Type: cross 要約:平面輸送システムの近年の台頭は、内部ロジスティクスと製造オペレーションの同時スケジューリングに対応し、フレキシブル製造システム(FMS)の再評価を必要とします。タイルベースの平面グリッド上で動作することにより、これらのシステムは従来の直列ラインに見られる非効率性を緩和し、個別の移動体(movers)に全 2 次...
Original: arXiv:2604.21029v1 Announce Type: cross Abstract: The recent emergence of planar transport systems necessitates re-evaluation of Flexible Manufacturing Systems (FMS) to address the simultaneous sched...