2031 articles

arxiv_cs_ai 2026/4/24

構造化された論争体系における理路的性公理の充足:演繓的支援による技術報告

Satisfying Rationality Postulates of Structured Argumentation Through Deductive Support -- Technical Report

arXiv:2604.21515v1 Announce Type: new 要約:ASPIC スタイルの構造化された論争枠組みは、内部の論争構造と抽象的な論争演繓を組み合わせて、人工知能における論理推論の形式基盤を提供します。これらの枠組みにおける重要な課題は、閉合性、直接の一貫性、間接の一貫性、非介入、およびクラッシュ耐性という 5 つの臨界の理路的性公理の準拠を確保することです。最近のアプロー...

Original: arXiv:2604.21515v1 Announce Type: new Abstract: ASPIC-style structured argumentation frameworks provide a formal basis for reasoning in artificial intelligence by combining internal argument structur...

arxiv_cs_ai 2026/4/24

BioMiner: リテラチュアから自動的に抽出されたタンパク質 - 配位子の生物活性データを多モーダルに自動マイニングするシステム

BioMiner: A Multi-modal System for Automated Mining of Protein-Ligand Bioactivity Data from Literature

arXiv:2604.21508v1 Announce Type: new Abstract: リテラチュアに公表されたタンパク質 - 配位子の生物活性データは医薬品開発にとって不可欠です。しかし、急速に増え続けるリテラチュアに追いつくために、手動での編集は困難となっています。自動的な生物活性の抽出は、依然として挑戦的であり、それはテキスト、テーブル、図表に分散された化学バイオサイエンスのセマン...

Original: arXiv:2604.21508v1 Announce Type: new Abstract: Protein-ligand bioactivity data published in the literature are essential for drug discovery, yet manual curation struggles to keep pace with rapidly g...

arxiv_cs_ai 2026/4/24

GeoMind: 論理推論に基づくツールの呼出を伴う層位分類のエージェント型ワークフロー

GeoMind: An Agentic Workflow for Lithology Classification with Reasoned Tool Invocation

arXiv:2604.21501v1 Announce Type: new\n摘要:井戸層記(well logs)における層位分類は、マルチディメンショナルな地球物理学シーケンスから岩石タイプを推論する、基礎となる地球科学データマイニングタスクです。最近の進歩にもかかわらず、既存のアプローチは典型的に、問題の静的な一段階的な判别的マッピングとして定式化されています。この静的パラダイムは、地質学的基...

Original: arXiv:2604.21501v1 Announce Type: new Abstract: Lithology classification in well logs is a fundamental geoscience data mining task that aims to infer rock types from multi dimensional geophysical seq...

arxiv_cs_ai 2026/4/24

英語の新聞メディアがインドにおける人々との象の衝突をどのように捉え写しているか

How English Print Media Frames Human-Elephant Conflicts in India

arXiv:2604.21496v1 発表型:新 要旨:インド全域で、生息地の消失と人類集落の拡大によって象との接触が近接し、人々との象との衝突(HEC)が深刻化している。生態的な衝突の駆動力は十分に研究されてきたが、ニュースメディアがそれらをどう描写しているかについてはほとんど探求されていない。本研究は、2022 年 1 月から 2025 年 9 月にかけて発行された主要な英語系メディアから 1...

Original: arXiv:2604.21496v1 Announce Type: new Abstract: Human-elephant conflict (HEC) is rising across India as habitat loss and expanding human settlements force elephants into closer contact with people. W...

arxiv_cs_ai 2026/4/24

Diversity-Guided User Simulation による効率的なエージェント評価

Efficient Agent Evaluation via Diversity-Guided User Simulation

arXiv:2604.21480v1 Announce Type: new 要約: 大規模言語モデル (LLMs) は顧客向けのエージェントとしてますます導入されていますが、確率的かつ複数のターンを交わる相互作用により、それらの信頼性の評価は依然として課題です。現在の評価プロトコルは、エージェントとユーザーの会話全体を完全に再生成して成功確率を推定するために、線形モンテカルロシミュレーションに頼っ...

Original: arXiv:2604.21480v1 Announce Type: new Abstract: Large language models (LLMs) are increasingly deployed as customer-facing agents, yet evaluating their reliability remains challenging due to stochasti...

arxiv_cs_ai 2026/4/24

AI-Gram: 視覚エージェントがソーシャルネットワークの中で相互作用する時

AI-Gram: When Visual Agents Interact in a Social Network

arXiv:2604.21446v1 Announce Type: new すべての参加者が LLM 駆動のエージェントである、完全自律的多エージェント視覚ネットワークにおける社会的ダイナミクスを研究するために、画像ベースの相互作用を可能にするライブプラットフォーム「AI-Gram」を提案します。该平台を用いて、エージェントが視覚メディアを通じてどのようにコミュニケーションし適応するかを実験的に検...

Original: arXiv:2604.21446v1 Announce Type: new Abstract: We present AI-Gram, a live platform enabling image-based interactions, to study social dynamics in a fully autonomous multi-agent visual network where ...

arxiv_cs_ai 2026/4/24

HiCrew: 問题认知型マルチエージェント協力による長尺動画理解のための階層的理由推理

HiCrew: Hierarchical Reasoning for Long-Form Video Understanding via Question-Aware Multi-Agent Collaboration

arXiv:2604.21444v1 Announce Type: new 要旨: 長尺な動画理解は、長時間的水平にわたる汎用的な空間時間重複と複雑な物語的依存関係によって、根本的に困難な課題に直面しています。最近の構造化表現は視覚情報を効果的に圧縮しますが、原因推理において不可欠である時間的一貫性を犠牲にすることがよくあります。また、既存のマルチエントフレームワークは、厳格で事前定義されたワー...

Original: arXiv:2604.21444v1 Announce Type: new Abstract: Long-form video understanding remains fundamentally challenged by pervasive spatiotemporal redundancy and intricate narrative dependencies that span ex...

arxiv_cs_ai 2026/4/24

簡易なチャットボットの対話が人間の内面的な道徳的価値に持続的な変化をもたらす

Brief chatbot interactions produce lasting changes in human moral values

arXiv:2604.21430v1 Announce Type: new 要旨:道徳的評価は人間の社会的行動や社会システムの基礎をなしている。人工知能(AI)のチャットボットは個人へのアドバイザーとしてますます重要性を増しており、しかしその道徳的評価への影響についてはほとんど探られていない。本研究では、内因子自然主義パラダイムを用い、道徳的な判断が変化するかどうかを調査した。53名の参加者が道...

Original: arXiv:2604.21430v1 Announce Type: new Abstract: Moral judgements form the foundation of human social behavior and societal systems. While Artificial Intelligence chatbots increasingly serve as person...

arxiv_cs_ai 2026/4/24

FairQE: 性別バイアスの軽減のための多エージェントフレームワーク翻訳品質評価において

FairQE: Multi-Agent Framework for Mitigating Gender Bias in Translation Quality Estimation

arXiv:2604.21420v1 Announce Type: new Abstract:品質評価(QE)は、参照翻訳なしで機械翻訳の品質を評価することを目的としますが、最近の研究では既存の QE モデルがシステム的な性別バイアスを示していることが明らかになりました。特に、それらは性別が曖昧な文脈において男性的な実現形式を好む傾向があり、性別が明示的に指定されていても性別と整合していない翻訳...

Original: arXiv:2604.21420v1 Announce Type: new Abstract: Quality Estimation (QE) aims to assess machine translation quality without reference translations, but recent studies have shown that existing QE model...

arxiv_cs_ai 2026/4/24

SemanticAgent: セマンティックに意識されたテキストから SQL へのデータ合成のためのフレームワーク

SemanticAgent: A Semantics-Aware Framework for Text-to-SQL Data Synthesis

arXiv:2604.21414v1 発表タイプ:新 サマリー:既存のテキストから SQL への合成パイプラインでは、実行可能性とセマンティック的な妥当性が混同されています。構文チェックと実行ベースの検証だけでは、データベースのセマンティクスを違反しても実行に成功するクエリが保たれる可能性があります。これらの制限を解消するため、我々はセマンティックに意識された合成フレームワークである Seman...

Original: arXiv:2604.21414v1 Announce Type: new Abstract: Existing text-to-SQL synthesis pipelines still conflate executability with semantic validity: syntactic checks and execution-based validation can retai...

arxiv_cs_ai 2026/4/24

分散 AI 推論システムにおける時間、因果律および観測性障害

Time, Causality, and Observability Failures in Distributed AI Inference Systems

arXiv:2604.21361v1 Announce Type: new 要約: 分散 AI 推論パイプラインは、システム挙動を理解するために時間ベースの観測性に大きく依存しています。本稿は、ノード間の微小なクロックズキが観測性を因果的に誤った状態にする一方で、システム自体が機能的に正しくパフォーマンスを維持することが示されています。我々は、単一ステージでクロックズキを誘導したマルチノード AI...

Original: arXiv:2604.21361v1 Announce Type: new Abstract: Distributed AI inference pipelines rely heavily on timestamp-based observability to understand system behavior. This work demonstrates that even small ...

arxiv_cs_ai 2026/4/24

ReaGeo: LLM を活用した推論強化型エンドツーエンドジオコーディング

ReaGeo: Reasoning-Enhanced End-to-End Geocoding with LLMs

arXiv:2604.21357v1 発表形式:新 Abstract: この論文は、従来のテキストまたはベクター類似検索に依存する多段階アプローチの制約(ワークフローの複雑さ、エラーの伝播、構造化された地理データベースへの重依赖)を克服するように設計された、大規模言語モデルに基づくエンドツーエンドジオコーディングフレームワーク「ReaGeo」を提案します。本方法は、地理座標をジオハッシュシーケンシ...

Original: arXiv:2604.21357v1 Announce Type: new Abstract: This paper proposes ReaGeo, an end-to-end geocoding framework based on large language models, designed to overcome the limitations of traditional multi...

arxiv_cs_ai 2026/4/24

再利用可能なクロスドメインパイプラインを用いた AI 会議サマリーの評価

Evaluating AI Meeting Summaries with a Reusable Cross-Domain Pipeline

arXiv:2604.21345v1 Announce Type: new Abstract: 本稿では、汎用性のある生成 AI アプリケーションの評価パイプラインを提示し、AI 会議サマリーのためにインスタンス化するとともに、データパイプラインから派生したパブリックアセットパッケージとともにリリースする。このシステムは、ソースインテイク、構造化参照の構築、候補生成、構造化評価、報告の 5 つ...

Original: arXiv:2604.21345v1 Announce Type: new Abstract: We present a reusable evaluation pipeline for generative AI applications, instantiated for AI meeting summaries and released with a public artifact pac...

arxiv_cs_ai 2026/4/24

LLM の経済的因果推論における思想偏見

Ideological Bias in LLMs' Economic Causal Reasoning

arXiv:2604.21334v1 発表 タイプ:新しい 要約:大規模言語モデル(LLM)は、経済的な因果効果に関する因果推論において、系長的な思想偏見を示すのか?LLM が政策分析や経済報道においてますます利用され、方向性が正しい因果判断が不可欠な状況において、この問題は直接的な実務的価値を持つ。我々は、思想に争われる事例(介入志向(政府支持)と市場志向(市場支持)の視点が対照的な因果符号を予...

Original: arXiv:2604.21334v1 Announce Type: new Abstract: Do large language models (LLMs) exhibit systematic ideological bias when reasoning about economic causal effects? As LLMs are increasingly used in poli...

arxiv_cs_ai 2026/4/24

LLM メモリのための空間的概念:MemPalace アーキテクチャの批判的分析

Spatial Metaphors for LLM Memory: A Critical Analysis of the MemPalace Architecture

arXiv:2604.21284v1 発表タイプ:新規 要約: MemPalace は、古代の立位法(記憶の宮殿)という空間的概念を適用して、大型言語モデルの長期記憶を組織化するオープンソース AI メモリシステムです。2026 年 4 月にローンチされ、最初の 2 ヶ月間で 47,000 点以上の GitHub ステアーズを達成し、LongMemEval ベンチマークで 96.6% の Reca...

Original: arXiv:2604.21284v1 Announce Type: new Abstract: MemPalace is an open-source AI memory system that applies the ancient method of loci (memory palace) spatial metaphor to organize long-term memory for ...

arxiv_cs_ai 2026/4/24

MMLMs は欠けている何を「読み取れる」のか?

Can MLLMs "Read" What is Missing?

arXiv:2604.21277v1 発表タイプ:新規 要約:我々は、マルチモーダル大規模言語モデル(MLLM)が視覚的文脈からマスクされたテキストを直接再構築する内在的な能力を評価するために設計された MMTR-Bench というベンチマークを導入します。従来の質問応答タスクとは異なり、MMTR-Bench は明示的なプロンプトを排除し、ドキュメントやウェブサイトなど実世界のドメインにおいてシン...

Original: arXiv:2604.21277v1 Announce Type: new Abstract: We introduce MMTR-Bench, a benchmark designed to evaluate the intrinsic ability of Multimodal Large Language Models (MLLMs) to reconstruct masked text ...

arxiv_cs_ai 2026/4/24

カテゴリー感のある MoE と LLM ベースのデータ拡張を活用したオンラインリクルートメントの強化

Enhancing Online Recruitment with Category-Aware MoE and LLM-based Data Augmentation

arXiv:2604.21264v1 発表型:新しい 要約:Person-Job Fit (PJF) はオンラインリクルートメントにおける重要な要素です。既存のアプローチには、低品質なジョブ説明と候補者−仕事のパラが低いケースを扱い、モデルの性能を損なうという課題があります。これらの課題に対処するため、この論文では、以下の 2 つの新しい技法を備えた、大規模言語モデル(LLM)ベースの方法を提案し...

Original: arXiv:2604.21264v1 Announce Type: new Abstract: Person-Job Fit (PJF) is a critical component for online recruitment. Existing approaches face several challenges, particularly in handling low-quality ...

arxiv_cs_ai 2026/4/24

メタ述語とドメイン特化言語を用いた信頼性の高い臨床意思決定支援

Trustworthy Clinical Decision Support Using Meta-Predicates and Domain-Specific Languages

arXiv:2604.21263v1 Announce Type: new **背景:** EU AI 法や AI/ML ベースの医療機器に関する FDA のガイダンスを含む医療における AI の規制枠組みは、臨床意思決定支援が単に精度だけでなく、監査可能性も示さなければならないことを要求しています。現行の臨床論理のための形式言語は、文法や構造的な正しさを検証しますが、意思決定ルールが認識論的に...

Original: arXiv:2604.21263v1 Announce Type: new Abstract: \textbf{Background:} Regulatory frameworks for AI in healthcare, including the EU AI Act and FDA guidance on AI/ML-based medical devices, require clini...

arxiv_cs_ai 2026/4/24

部分観測マルコフ意思決定過程(POMDP)政策に対する観測擾乱への頑健性の解析

Robustness Analysis of POMDP Policies to Observation Perturbations

arXiv:2604.21256v1 Announce Type: new 要旨:部分観測マルコフ意思決定過程(POMDP)の政策は、通常、標準システムモデルを使用して設計されます。実運用においては、このモデルが真のシステムから微細な漂移やセンサーの劣化といった要因により外れる場合があり、予想外のパフォーマンス低下を引き起こします。本稿では、POMDP 観測モデルに対する偏離に対する政策の頑健性を...

Original: arXiv:2604.21256v1 Announce Type: new Abstract: Policies for Partially Observable Markov Decision Processes (POMDPs) are often designed using a nominal system model. In practice, this model can devia...

arxiv_cs_ai 2026/4/24

ReCAPA:層階的予測校正により、連鎖故障を緩和する

ReCAPA: Hierarchical Predictive Correction to Mitigate Cascading Failures

arXiv:2604.21232v1 発表型:新 概要: 視覚 - 言語 - 行動(VLA)システムは、マルチモーダル環境において複数のステップをわたるタスクを実行するための指示に従います。最近の VLA アプローチでは、事後の補正メカニズムに頼ることが多く、あるいは固定されたタスク分解とアライメントスキームの下で動作しています。しかし、中間ステップが誤って指定されると、局所的な誤差は次のステップ...

Original: arXiv:2604.21232v1 Announce Type: new Abstract: Vision-Language-Action systems follow instructions to execute multi-step tasks in multimodal environments. Recent VLA approaches typically rely on post...