2031 articles
CausalT5K: めいがくていりょうに対する疑問への対応診断と情報を提供する、信頼できる因果リテラシーの理解を促進
CausalT5K: Diagnosing and Informing Refusal for Trustworthy Causal Reasoning of Skepticism, Sycophancy, Detection-Correction, and Rung Collapse
LLMによる因果性の判断においては、クーポインティングの問題やラング・コラプシオンの問題など、疑問に対する不十分な反応といった失敗例が一般的に知られています。しかし対策に関してはまだ発展途上です。このため、適切な評価基盤がないためです。我々は、十つの異なるトピックに対して合計5,000件以上の症例を対象とした診断基盤であるCausalT5Kを開発しました。これは以下の3つの重要な能力をテストするよ...
Original: arXiv:2602.08939v1 Announce Type: new Abstract: LLM failures in causal reasoning, including sycophancy, rung collapse, and miscalibrated refusal, are well-documented, yet progress on remediation is s...
Cofine: 安定テスト時コンピューティングにおける信頼性に基づく自精査法
CoRefine: Confidence-Guided Self-Refinement for Adaptive Test-Time Compute
大型言語モデル (LLMs) の多くは、 parallel decoding(たとえば、512サンプル)を利用して推理の精度を高めることで、テスト時での縮小力を多く利用しています。しかしこれには大きなコンピューティングが伴います.私たちのグループは CoRefine という自信に基づく自精査法を導入しました。 この方法は、フルトレースの信頼性を使って停止、リエスミング、または別のアプローチを試すと...
Original: arXiv:2602.08948v1 Announce Type: new Abstract: Large Language Models (LLMs) often rely on test-time scaling via parallel decoding (for example, 512 samples) to boost reasoning accuracy, but this inc...
デジタルツインとAgentic AIによる森林火災 Disaster Management:機能性の高い仮想状況室
Digital Twin and Agentic AI for Wild Fire Disaster Management: Intelligent Virtual Situation Room
国連によれば、温暖化により2030年までに火事が頻繁になり強度が約14%増える見込みで、生命・インフラ設施・生態系への影響から、災害管理の一覧は、静的シミュレーションと静的なデータ収集に依存。これによってあらかじめ定まられる火事のエピソードに対応し得るようになれない。適時にその様態を変動させるためのIVSR(Intelligent Virtual Situation Room:機能性の高い仮想状況...
Original: arXiv:2602.08949v1 Announce Type: new Abstract: According to the United Nations, wildfire frequency and intensity are projected to increase by approximately 14% by 2030 and 30% by 2050 due to global ...
stable-worldmodel-v1: ワールドモデルの研究と評価に適用可能な再現性を保証する世界的なモデル
stable-worldmodel-v1: Reproducible World Modeling Research and Evaluation
世界のモデルは、環境動態に対する収括可能な予測表現を学習し、代理者は直接の経験を超えて理屈をつけたり計画をすることができます。しかしながら最近の興味があるワールドモデルにつきましては、多数の現在の実装が発表ごとに特定化されており、より多くのリスクを生むばかりです。そのため我々にSWM(安定したワールドモデル)というモジュールであり検証された仕様としては定義されていた環境モデルを開発しました。これは...
Original: arXiv:2602.08968v1 Announce Type: new Abstract: World Models have emerged as a powerful paradigm for learning compact, predictive representations of environment dynamics, enabling agents to reason, p...
InternAgent-1.5: 長期間の自動的な科学的発見に優れた統合関節框架
InternAgent-1.5: A Unified Agentic Framework for Long-Horizon Autonomous Scientific Discovery
私たちにより InternAgent-1.5 を導入する。これは、コンピューターモデルと論理実験両方に渡って幅広い範囲で科学的発見に対する一貫したシステムであるという意図を置いた新規なものです。このシステムは、生成、確認、進化の三つの協調的な子子系によって構成された構造的なアーキテクチャに基づいている。これらの子子系は基礎的な能力:深い研究、ソリューション最適化、そして長期間に渡っての記憶、を支え...
Original: arXiv:2602.08990v1 Announce Type: new Abstract: We introduce InternAgent-1.5, a unified system designed for end-to-end scientific discovery across computational and empirical domains. The system is b...
iGRPO: 自己フィードバックに基づくLLMの推理
iGRPO: Self-Feedback-Driven LLM Reasoning
大量言語模型 (LLMs) は複雑な数学的問題を解くことに画期的な効果を見せていますが、まだ正確で共通的な解決策を作成することはできません。再現学習 (RL) フレームワークを使用してこれらのモデルをタスク固有の報酬に合わせることでこの欠点を補うことができるのです。 Group Relative Policy Optimization (GRPO) は、価値関数がない価値機能無料の Proxim...
Original: arXiv:2602.09000v1 Announce Type: new Abstract: Large Language Models (LLMs) have shown promise in solving complex mathematical problems, yet they still fall short of producing accurate and consisten...
データサイエンスと技術がAGIへの道 Part I: ドライバーデータの統合管理
Data Science and Technology Towards AGI Part I: Tiered Data Management
人工知能の開発は、逐次なったデータ操作がもたらす学習のパラダイム遷移を経験した後,より具体的な情報の整理と活用により常にモデル能力が上昇するように考えられます。 現在のLLM研究では、巨大な一方向的なデータサイズ拡張に頼ることによって、データ利用可能性や取得コスト等、新たな壁に遭遇しています。この論文では、AGI開発はデータとモデルが相互的に進化しているという新しいステージに入れると主張し、データ...
Original: arXiv:2602.09003v1 Announce Type: new Abstract: The development of artificial intelligence can be viewed as an evolution of data-driven learning paradigms, with successive shifts in data organization...
BERT分かち書き学習(と教え方):有機化学の面を
BERT Learns (and Teaches) Chemistry
現代の計算機化有機化学は、ますますデータ駆動型になっています。このようなこの領域で重要な未解決問題があるためです、例えば、反応物がどのような製品を予測するのか、薬物開発と分子合成で最適な評価指標となることを学びたい構造の探索です。しかしながら、これらの問題は最近では機械学习を使用することで対処しようとしています。我々は、テラーニュ型モデル(BERT)をデータ駆動的に反応物のストリング表現のデータセ...
Original: arXiv:2007.16012v1 Announce Type: cross Abstract: Modern computational organic chemistry is becoming increasingly data-driven. There remain a large number of important unsolved problems in this area ...
超音波専用の自己 Supervised 学習を活用した胎児画像で巣胞腫の検出改善
Improved cystic hygroma detection from prenatal imaging using ultrasound-specific self-supervised representation learning
巣胞腫は難ありとされる胎児超音波判別の発見が、子宮内での Chromosomal abnormalities、構造的な障害および妊娠リスクがある可能性が高い。自動的な検出しを増大させることが再現性を高め、スケーラブルで初期のスクリーニングプログラムを支援できるが、監 labelデータセットの限られた数量によって制限される Supervised 関連した深層学習法による分析です。 この研究は、第一 ...
Original: arXiv:2512.22730v2 Announce Type: cross Abstract: Cystic hygroma is a high-risk prenatal ultrasound finding that portends high rates of chromosomal abnormalities, structural malformations, and advers...
多様なマルチロボットの協調を大規模言語モデルを使用した適応的グループ交渉フレームワークで強化する
Leveraging Adaptive Group Negotiation for Heterogeneous Multi-Robot Collaboration with Large Language Models
マルチロボットの協調タスクは、さまざまなロボットがスペース制約や環境不確実性の中で長期間にわたって一緒に働くことでよくあります。大規模言語モデル(LLM)は推理と計画において優れているとされていますが、その統合制御への可能性を完全に探求していないようです。人間のチームワークをモチーフにして、CLiMRS (コホスLarge-Language-Model・駆動多種なマルチロボットシステム)と名付けら...
Original: arXiv:2602.06967v1 Announce Type: cross Abstract: Multi-robot collaboration tasks often require heterogeneous robots to work together over long horizons under spatial constraints and environmental un...
BiomechAgent:コード生成AI代理人を通じてバイオメカニカル分析をサポート
BiomechAgent: AI-Assisted Biomechanical Analysis Through Code-Generating Agents
マーカーなしの運動捕捉は,行動分析の数値的視覚化がもっと一般的になることから,医療者はプログラミング上の知識がない場合バイオメカニクスに関する結果の評価が依然として障壁となっている。我々は、BiomechAgentというコード生成AI代理人を提案します。これは、バイオメカニクス分析を自然言語を通じて可能にするためで,利用者はデータベースから情報を検索し,ビジュアル化を作成し,またデータの解釈に至る...
Original: arXiv:2602.06975v1 Announce Type: cross Abstract: Markerless motion capture is making quantitative movement analysis increasingly accessible, yet analyzing the resulting data remains a barrier for cl...
セーフティとは?企業は如何に「安全」という概念を構築し、共有するか
What is Safety? Corporate Discourse, Power, and the Politics of Generative AI Safety
この研究では、生成式人工知能(AI)のリーダー企業が公的文書を通じて、「安全」という概念どのように構築し、共有しているのかを探る。「批判的言語分析」に基づき、社内の安全保障に関する声明をコーラスとして分析する。これには権力、責任、および合法性という言語が成立した様子に焦点を当てている。これらの言語戦略は企業の参加を強制し、科学技術的な実験と予測性の役割の正常化を達成している。この論文では、「安全性...
Original: arXiv:2602.06981v1 Announce Type: cross Abstract: This work examines how leading generative artificial intelligence companies construct and communicate the concept of "safety" through public-facing d...
影響を受けた人々がAIの公平性評価を形作る:プロセス、基準とツール
Empowering Affected Individuals to Shape AI Fairness Assessments: Processes, Criteria, and Tools
AIシステムは、クレジット評価などの高リスク分野で広く使用され始めています。ここで起こされる決定に対する不平等懸念があります。現在の公平性評価では、主に専門家や規制者が一般的な保護属性と指標を使用して行われていますが、これは影響を受けた人々がどのように感じている公平性の複雑さやニュアンスについてうまく捉えていないことが知られています。最近の研究でも、より多くの人がこのような評価プロセスに関与すべき...
Original: arXiv:2602.06984v1 Announce Type: cross Abstract: AI systems are increasingly used in high-stakes domains such as credit rating, where fairness concerns are critical. Existing fairness assessments ar...
視点からスマートシステムに向けた中国語の外国語教育への新たなモードを研究: 蛱蝶型解釈からの観点
A New Mode of Teaching Chinese as a Foreign Language from the Perspective of Smart System Studied by Using Rongzhixue
この研究の目的は、智慧に基づく統合的な視点から中国語を外国語として教育する新しいモデルを導入することです。その特性は次のとおり:バイリンク思考トレーニングの新しい方法を強調し、特に文法や会話との関係性に関する新しく理論的な中国文字論、言語と話し相談間の関係性論、さらには科学的進歩結果を組み込んだ言語学に基づいています。さらにAIをサポートした教育活動にも言及しており、教育科学の現状も考慮されていま...
Original: arXiv:2602.06992v1 Announce Type: cross Abstract: The purpose of this study is to introduce a new model of teaching Chinese as a foreign language from the perspective of integrating wisdom. Its chara...
H级階立JEPAと予測的リモートコントロールの会合:5Gを超えるワイヤレスネットワーク
Hierarchical JEPA Meets Predictive Remote Control in Beyond 5G Networks
ワイヤレスネットワーク化された制御システムにおける分散デバイスからの時間帯的な状態記録へのタイムリーで信頼性の高い更新は、堅実なコントロール・パフォーマンムを確保するために重要です。しかし、多点からの高次元状態(例:画像またはビデオフレーム)を限られた帯域幅を持つ無線ネットワーク上で送信するとき、通信効率とコントロールのパフォーマンス間には重要なトレードオフが出現します。この課題に直面しているため...
Original: arXiv:2602.07000v1 Announce Type: cross Abstract: In wireless networked control systems, ensuring timely and reliable state updates from distributed devices to remote controllers is essential for rob...
マルチスケール時系列ホエーホエイが人工ニューラルネットワークを効率的で頑 弾しい化する
Multi-Scale Temporal Homeostasis Enables Efficient and Robust Neural Networks
人工ニューラルネットワークは、基準となるタスクで強力な性能 を達成します。しかし、これらのネットワークにとって不安定な一部の 彼らは、関連性や構造を壊すような影響を受けた信号に対して、より 非効率的または機能しないことがしばしばです.一方で、生物学的な神経系 は数十年で安定的な機能を維持し続けて、さまざまな時系列スケールの ホエホエイによってコントロールされています。それはこの原理に基づいて Mu...
Original: arXiv:2602.07009v1 Announce Type: cross Abstract: Artificial neural networks achieve strong performance on benchmark tasks but remain fundamentally brittle under perturbations, limiting their deploym...
ADのシグネチャーアルゴリズムを介するEEGとヒビクーニングニューラルネットワーク、及びバイオフォシマイクデモンストレーション間の結びつき
Learning Alzheimer's Disease Signatures by bridging EEG with Spiking Neural Networks and Biophysical Simulations
アルツハイマー病の患者数が増え続けているため、非侵襲的で生物的特徴物質からの解説が重要性を増しています。最新の研究では、脳内の改ざんは、electroencephalography (EEG) のスペクトラメソッドに見られるため、機械学習を使用して検出されることが示唆されています。しかし、一般的な深層学習はEEGベースのADの診断には計算を費やすだけでなく論理的な透明性も欠けていることを問題とし、...
Original: arXiv:2602.07010v1 Announce Type: cross Abstract: As the prevalence of Alzheimer's disease (AD) rises, improving mechanistic insight from non-invasive biomarkers is increasingly critical. Recent work...
LLMエージェントの行動的一貫性に対する評価: ストップ・マーケットシミュレーションにおけるトレーディングスタイルの切り替え
Behavioral Consistency Validation for LLM Agents: An Analysis of Trading-Style Switching through Stock-Market Simulation
最近の研究では、大規模言語モデル (LLMs) を金融のストップ・マーケットシミュレーション中に使用することで、微視的な行動がマクロ階層レベルのこと象として集約されることを検証したことが多々です。しかし、重要な問題は:LLMエージェントの行動が現実市場参加者の行に合致しているのでしょうか?その一致はシミュレート結果の有効性を証明します。この探求のために、我々は金融ストップ・マーケットシナリオを選ば...
Original: arXiv:2602.07023v1 Announce Type: cross Abstract: Recent works have increasingly applied Large Language Models (LLMs) as agents in financial stock market simulations to test if micro-level behaviors ...
MENAspeechbank:アソシエートデータの制御可能なPipelineおよびPersona条件付き複数のターン会話に基づく多言語音声財図
MENASpeechBank: A Reference Voice Bank with Persona-Conditioned Multi-Turn Conversations for AudioLLMs
Audio 大規模言語モデル (AudioLLM)は、ストレートフォールディングを含むスピーカーと一般的なオーディオを利用して指示に従うが、データの多様性、会話形態と指導されているテキストからの充足が不足しています。特にポーサージングされたインタラクションやダイアLECTAL ビユートをカバーする時には、現実での複数のスピーカーからリクエストを収集し公開をするのは難しいです。我々はMENAspee...
Original: arXiv:2602.07036v1 Announce Type: cross Abstract: Audio large language models (AudioLLMs) enable instruction-following over speech and general audio, but progress is increasingly limited by the lack ...
優さが知的生産から脱却するとき:研究資金の改革を振り返る研究者の観察
When Excellence Stops Producing Knowledge: A Practitioner's Observation on Research Funding
私は長年にわたって競争的研究資金に参加してきました──申請者、コーディネーター、評価者として,そして審査員として。それ以来、多くの参加者は現行システムが機能的な限界に近づいていると認識しています。しかし、改革はこの基本的なダイナミクスを緩和することはありません。本稿は2つの特に明らかになった分野における優さと知識生産の分離について紹介します:競争的基礎研究資金と大きな連携プロジェクト。これらのトレ...
Original: arXiv:2602.07039v1 Announce Type: cross Abstract: After almost four decades of participating in competitive research funding -- as applicant, coordinator, evaluator, and panel member -- I have come t...