2031 articles
EventCast: ハイブリッドイベント型需給予測を支援するLLMベースの知的知識
EventCast: Hybrid Demand Forecasting in E-Commerce with LLM-Based Event Knowledge
需要予測は電子商取引操作の根幹要素であり、在庫計画と配荷スケジューリングに直結します。しかし、特定の状況において(特別セールや祝日のキャンペーンなど)、イベントが突如シフトし始めるため、既存の予測システムはしばしば機能しません。このような問題に対して、我々はEventCastというmodularな予測フレームワークを提案しました。これはfutureイベント情報とシグネチャ付き時-series予測に...
Original: arXiv:2602.07695v1 Announce Type: new Abstract: Demand forecasting is a cornerstone of e-commerce operations, directly impacting inventory planning and fulfillment scheduling. However, existing forec...
Geo-コード:二段階マルチ・ア gent の進化に基づく幾何画像からの逆生成ためのコーディングフレームワーク
Geo-Code: A Code Framework for Reverse Code Generation from Geometric Images Based on Two-Stage Multi-Agent Evolution
プログラミング コードは、視覚と論理の桥梁を形成し、大規模モデルの誘導用い可能な複数モーダルの推定能力を向上させるために微細な几何的操作として補助線の構築や視点変換のような幾何学操作を使用する可視的な手法である。現在存在する逆画像作成方法は、複雑て幾何形詳細に関する正確な再構成という非常に大きな課題に直面するため困難を極めていることは、重要な幾何論的制約の失われまたは構造歪曲がしばしば起こっている...
Original: arXiv:2602.07749v1 Announce Type: new Abstract: Program code serves as a bridge linking vision and logic, providing a feasible supervisory approach for enhancing the multimodal reasoning capability o...
AIによる人間中心の評価:公正性、信頼性、一貫性及び透明性に関する学生からの洞察
Humanizing AI Grading: Student-Centered Insights on Fairness, Trust, Consistency and Transparency
この研究では、人工知能(AI)による成績評価システムの undergraduate computer science コースの学生たち(n = 27)に対する反応を調査し、ブロックベースプログラミングの最終プロジェクトに焦点を当てています。Jobin (2019)が提示した道徳的原則に基づき、AIによる評価における公平性、信頼性、一貫性、および透明性は比較されつつあります。AIによって生成されたフ...
Original: arXiv:2602.07754v1 Announce Type: new Abstract: This study investigates students' perceptions of Artificial Intelligence (AI) grading systems in an undergraduate computer science course (n = 27), foc...
学習を継続するための学習を学ぶ:メタ学习とアジェンダ記憶設計
Learning to Continually Learn via Meta-learning Agentic Memory Designs
Original: arXiv:2602.07755v1 Announce Type: new Abstract: The statelessness of foundation models bottlenecks agentic systems' ability to continually learn, a core capability for long-horizon reasoning and adap...
ネットワーキングの観測データに対する統治変量イノベーション:ディスイントラブラウンズとインストルメンタル・バリエイアン
Disentangled Instrumental Variables for Causal Inference with Networked Observational Data
Original: arXiv:2602.07765v1 Announce Type: new Abstract: Instrumental variables (IVs) are crucial for addressing unobservable confounders, yet their stringent exogeneity assumptions pose significant challenge...
Dozensのデバイスが眠れる電動画面? オープンソースソフトウェア MinTapでAndroidWorldに完璧な精度を達成
Do Multi-Agents Dream of Electric Screens? Achieving Perfect Accuracy on AndroidWorld Through Task Decomposition
Original: arXiv:2602.07787v1 Announce Type: new Abstract: We present Minitap, a multi-agent system that achieves 100% success on the AndroidWorld benchmark, the first to fully solve all 116 tasks and surpassin...
データダイバレンシズ パートI:科学的数据を元にする学習の価値を解釈する
Data Darwinism Part I: Unlocking the Value of Scientific Data for Pre-training
arXiv:2602.07824v1 投稿種類:新しい 要約:データ品質がモデルパフォーマンスに影響しますが、統一的な処理フレームワークは不足しています。私たちはData Darwinism tenレベルの分類(L0-L9)を紹介し、データとモデルの共同進化という観念を解釬しました:先端的なモデルは後に世代されるスイートなデータを作ります。科学文献を用いてDarwin-Scienceという900B...
Original: arXiv:2602.07824v1 Announce Type: new Abstract: Data quality determines foundation model performance, yet systematic processing frameworks are lacking. We introduce Data Darwinism, a ten-level taxono...
タイムーシリーズの理解答策: データ合成とスケジューリングを通じて動的思考の確立
Time Series Reasoning via Process-Verifiable Thinking Data Synthesis and Scheduling for Tailored LLM Reasoning
時間系列データは、様々なアプリケーション領域で存在し、 diverseな時間シリーズ作業を解決する理由は長年の目標です。LARGE言語モデル(LLM)の最新の進歩、特にそのリッスン機能を通じて再構築学習(RL)によって開放された能力により、長期間のChain-of-Thought (CoT) リソースを必要とするタスクに対処する新たな機会が開かれています。ただし、LLMのリソースへのアプローチはま...
Original: arXiv:2602.07830v1 Announce Type: new Abstract: Time series is a pervasive data type across various application domains, rendering the reasonable solving of diverse time series tasks a long-standing ...
LQA: アップライト化された量子化適応フрейマワークによる視覚言語モデルのオンデルビュープロセッシングへの適用
LQA: A Lightweight Quantized-Adaptive Framework for Vision-Language Models on the Edge
Original: arXiv:2602.07849v1 Announce Type: new Abstract: Deploying Vision-Language Models (VLMs) on edge devices is challenged by resource constraints and performance degradation under distribution shifts. Wh...
緊急の不整合は容易だが、狭い不整合は難しい
Emergent Misalignment is Easy, Narrow Misalignment is Hard
arXiv:2602.07852v1 新しく投稿種類:new 抄録: largescale言語モデルを狭義的に有害なデータセットに微調整したときはこれらが緊急の非整定を引き起こし、異なる関連性ない複数のさまざまな設定に対して典型的に対象とする `悪' の応答を持つようにさせることがあります。 disturbingには、専門家向けの前注録された調査はこの結果を予測していません、これは largesc...
Original: arXiv:2602.07852v1 Announce Type: new Abstract: Finetuning large language models on narrowly harmful datasets can cause them to become emergently misaligned, giving stereotypically `evil' responses a...
ToolSelf: 変化するタスク実行と自己調整を統合するツール駆動的な自己修飾を提供する
ToolSelf: Unifying Task Execution and Self-Reconfiguration via Tool-Driven Intrinsic Adaptation
アゲンスシステムの大規模言語モデル(GLM)が複雑で遠視的なタスクに対する驚異的な能力を示していることが証明されています。しかし、その有用性は、固定された状態設定によって決まる動的状況の行動の制約によって基づかれています。これは、作業進捗の変化に対応できないことから、一般的な適合性や分割された最適化を欠いています。これらの限界を越えるためには、新しいパラダイムであるToolSelfを提案します。こ...
Original: arXiv:2602.07883v1 Announce Type: new Abstract: Agentic systems powered by Large Language Models (LLMs) have demonstrated remarkable potential in tackling complex, long-horizon tasks. However, their ...
GCN-MPPR:モチーフベースの personalize ページロクによる情報伝播を用いたメッセージ駆動 Neural ネットワークの拡散強化
GCN-MPPR: Enhancing the Propagation of Message Passing Neural Networks via Motif-Based Personalized PageRank
メッセージ駆動的なニューラルネットワーク(MPNN)に基づくアルゴリズムは、様々なグラフ上の応用に対して大きな成功を収めています。ただし、これらの方法では情報が非常に限定された近傍にのみ浅い深さで推移し、特に平滑化によるものと考えられています。つまり、多くの既存のMPNNは「深い」ことを見落としています。一部の既存の文献はこの挑戦を最適化や構造レベルでの解決策により克服しようとしてきましたが、GC...
Original: arXiv:2602.07903v1 Announce Type: new Abstract: The algorithms based on message passing neural networks (MPNNs) on graphs have recently achieved great success for various graph applications. However,...
MedCoG:診療推論を最大化し、LAIのインフェクション密度に準拠するためのメタカognition制御
MedCoG: Maximizing LLM Inference Density in Medical Reasoning via Meta-Cognitive Regulation
大規模言語モデル (LLM) は複雑な医療推理において強い可能性を見せますが、スケーラビリティ法則に基づいた推論拡大面には diminishing gains を示しています。 現在の研究では LLM に様々な知識種類を追加しているが、これらの追加コストが効果的に精度を向上させるかどうかが不明です。 この論文では、LLM のメタカognition (事前把握した自分自身の知識状態に対する自己理解)...
Original: arXiv:2602.07905v1 Announce Type: new Abstract: Large Language Models (LLMs) have shown strong potential in complex medical reasoning yet face diminishing gains under inference scaling laws. While ex...
MePo:再構築記憶に基づくメタポスト・リファインのためのモデル
MePo: Meta Post-Refinement for Rehearsal-Free General Continual Learnin
外部環境が不定に変化するときに、知性システムは複雑で変化する環境から一貫して学習し、リアルタイムで反応することが求められます。その能力は一般的な連続的学习(GCL: General Continual Learning)と呼ばれています。この機能を効果的に満たす為にはネットワークのオンラインデータ流やぼやけたタスク境界などの現実的な課題に対処する必要があります。一部の研究は、強化学習モデルを使った...
Original: arXiv:2602.07940v1 Announce Type: new Abstract: To cope with uncertain changes of the external world, intelligent systems must continually learn from complex, evolving environments and respond in rea...
IVコサイエンティスト:多重代理人のLLMフрейameworkのカusalinstrumental変数発見
IV Co-Scientist: Multi-Agent LLM Framework for Causal Instrumental Variable Discovery
結局のところ、内生変量とアウトカム間の混雑に関わらず、インストラクタービームは、内生変量の因果効果を離脱するための手法として使用されます。有効なインストラクターベームの識別には、多学科的で革新的な知見とコンテキストに対する理解が必要であり、その目標は実質的に難しいタスクです。 この論文では、LLMがこの取組を支援するかどうか調査します。 まず、我々はLLMが既存の文献からの正当なインストラクターベ...
Original: arXiv:2602.07943v1 Announce Type: new Abstract: In the presence of confounding between an endogenous variable and the outcome, instrumental variables (IVs) are used to isolate the causal effect of th...
LOCA-bench: 様々な状況成長下の言語代理人のベンチマーク
LOCA-bench: Benchmarking Language Agents Under Controllable and Extreme Context Growth
大規模な言語モデル (LLMs) は、長時間の実世界のタスクを非常に有能力にしています。しかし、状況が増えるにつれて信頼性は通常低下し、これには「状況腐食」という名の現象として知られています。既存の長い状況ベンチマークでは、最も一般的な設定である一連のステップでモデルの情報参照能力を評価することが主に焦点となっています。実質的なスケーラビリティ条件下においては、LLMs は環境を探索し指示を追う、...
Original: arXiv:2602.07962v1 Announce Type: new Abstract: Large language models (LLMs) are increasingly capable of carrying out long-running, real-world tasks. However, as the amount of context grows, their re...
社会科学的研究を加速するためのアゲンテヒューレシズと実験
Accelerating Social Science Research via Agentic Hypothesization and Experimentation
統計的なデータに基づく社会科学研究は一貫して、観察→仮説生成→試験名 validation の反復循環に依存し、このプロセス全体を促進するデータ駆動型の手法が存在しても、それにより科学的発見全体を支援することはできません。そのため、本研究ではEXPERIGENと呼ばれるアゲンテファクエムを導入して、統計的な発見を操作化しました。EXPERIGENは、2次の検索を持つバイオインフォメーション Ins...
Original: arXiv:2602.07983v1 Announce Type: new Abstract: Data-driven social science research is inherently slow, relying on iterative cycles of observation, hypothesis generation, and experimental validation....
アダ表的で-scalableなかつ頑丈な大規模言語モデルのAgent間の協調: ユニバーサル多段式協調の目安
Towards Adaptive, Scalable, and Robust Coordination of LLM Agents: A Dynamic Ad-Hoc Networking Perspective
大規模言語モデル(LLMs)を基盤とするマルチエージェントアーキテクチャは、労力がかかるマニュアルへのオシレーションを通じて Swarmインテルシークエンスで実現することが示されています。一方、その大きな負荷に対する自動設計の要求は、ロビンフダンスングなソブサバストラッパーの設計により圧倒的です。我々のアジェントコダージョンの課題を動的にあらわれるネットワークへの問題としてフレーム化したということ...
Original: arXiv:2602.08009v1 Announce Type: new Abstract: Multi-agent architectures built on large language models (LLMs) have demonstrated the potential to realize swarm intelligence through well-crafted coll...
小代理群体是数字健康未来的可能性
Small Agent Group is the Future of Digital Health
デジタル健康管理の急速な採用は、大言語モデル (LLMs) の導入が進んでおり、「スケーリング・ファースト」の考え方により推奨されていました。つまり、アルゴリズムの大きさとデータが診療所で効果を高めるという考え込みでした。しかし、現場での実際の需要は単に有効性だけでなく、信頼性も考慮する必要があります。 また、医療決定作業は専門家間協力によるものであることから、そのモノリスな「スケーリング」のモデ...
Original: arXiv:2602.08013v1 Announce Type: new Abstract: The rapid adoption of large language models (LLMs) in digital health has been driven by a "scaling-first" philosophy, i.e., the assumption that clinica...
構造に敏感なリユーロック強度の対角的なガウシアンネットワーク分類器型の反論可能な説明法
Structure-Aware Robust Counterfactual Explanations via Conditional Gaussian Network Classifiers
説明人工知能(XAI)を広く使用されている因果推測およびモデル決定の理解と対策に関する説明のための重要なテクニックであり、カウンターフィアシブな経解(CE)は。この作品では、CGNCが生成的な構造を持っていることを基礎に基づいた反論可能な探索法が、条件ガウスネットワーク分類器 (CGNC) を利用しています。それは、連続の依存関係と特異的な因果関係を持つ制御可能で正則なグラフ(DAG)が含まれてい...
Original: arXiv:2602.08021v1 Announce Type: new Abstract: Counterfactual explanation (CE) is a core technique in explainable artificial intelligence (XAI), widely used to interpret model decisions and suggest ...