3496 articles
南アフリカにおける結核ケア用のドメイン固有型大型言語モデルの開発および事前評価
Development and Preliminary Evaluation of a Domain-Specific Large Language Model for Tuberculosis Care in South Africa
arXiv:2604.19776v1 発表種別:クロス 要旨:結核(TB)は世界的に最も致死率の高い感染性疾病の一つであり、南アフリカでは国の医療システムに重大な負担をかけます。この論文では、患者および医療提供者の負担を軽減する支援が可能となる、結核ケア用のドメイン固有型大型言語モデル(DS-LLM)の開発に関する実験的な研究を提示します。この実現に向け、現在の大型言語モデル(LLM)の開発戦略...
Original: arXiv:2604.19776v1 Announce Type: cross Abstract: Tuberculosis (TB) is one of the world's deadliest infectious diseases, and in South Africa, it contributes a significant burden to the country's heal...
TTKV: 長期文脈の LLM 推論のための階層的時系列 KV キャッシュ
TTKV: Temporal-Tiered KV Cache for Long-Context LLM Inference
arXiv:2604.19769v1 Announce Type: cross 要旨:キー値(KV)キャッシュは、大規模言語モデル(LLM)の効率的な推論において不可欠ですが、そのメモリ使用量は文脈長の線形比例を示し、深刻なスケーラビリティのボトルネックを招きます。既存の手法は、大部分が時間軸全体に KV ステートが同等に重要であると考え、均一な精度とアクセス可能性を仮定しています。しかし、この仮...
Original: arXiv:2604.19769v1 Announce Type: cross Abstract: Key-value (KV) caching is critical for efficient inference in large language models (LLMs), yet its memory footprint scales linearly with context len...
EvoForest: 計算グラフのオープンエンド進化に基づく新しい機械学習のパラダイム
EvoForest: A Novel Machine-Learning Paradigm via Open-Ended Evolution of Computational Graphs
arXiv:2604.19761v1 Announce Type: cross 要旨: 現代の機械学習は、パラメトライズされたモデルファミリーを選択してその重み最適化を行うという単一のレシピを中心に構成されており、その成功は広く認められています。しかし、このパラダイムは、データから計算すべきものを発見する必要がある構造的な予測問題において、パラメータのフィッティングではなく、計算すべきものを発見す...
Original: arXiv:2604.19761v1 Announce Type: cross Abstract: Modern machine learning is still largely organized around a single recipe: choose a parameterized model family and optimize its weights. Although hig...
ThermoQA: 大規模言語モデルにおける熱力学推論を評価するための 3 つの階層を備えたベンチマーク
ThermoQA: A Three-Tier Benchmark for Evaluating Thermodynamic Reasoning in Large Language Models
arXiv:2604.19758v1 Announce Type: cross 概要: 私たちは、3 つの階層に分類された 293 つのオープンエンドの工学熱力学問題からなるベンチマーク「ThermoQA」を提示します。これらの問題には、物性値の照会(110 Q)、コンポーネント解析(101 Q)、および完全サイクル解析(82 Q)が含まれています。真の解答(Ground truth)は Cool...
Original: arXiv:2604.19758v1 Announce Type: cross Abstract: We present ThermoQA, a benchmark of 293 open-ended engineering thermodynamics problems in three tiers: property lookups (110 Q), component analysis (...
LLM を用いた説明可能な AML 分類:証拠抽出と反事実チェック
Explainable AML Triage with LLMs: Evidence Retrieval and Counterfactual Checks
arXiv:2604.19755v1 Announce Type: cross 摘要:反マネーロンダリング(AML)取引監視では、厳格な監査およびガバナンス制約下で迅速に分類処理が必要な大量の警報が発生します。大型言語モデル(LLMs)は多様な証拠を要約し、根拠を草案化する能力がありますが、ハルシネーションや不確かな根拠、または基礎となる判断に忠実でない説明が存在する恐れにより、規制されたワーク...
Original: arXiv:2604.19755v1 Announce Type: cross Abstract: Anti-money laundering (AML) transaction monitoring generates large volumes of alerts that must be rapidly triaged by investigators under strict audit...
NGSS クラスルームにおける科学解説の AI スコアリングにおけるクラスの不均衡を解決するための、Transformer ベーベースモデルのデータ拡張およびリサンプリング戦略の探求
Exploring Data Augmentation and Resampling Strategies for Transformer-Based Models to Address Class Imbalance in AI Scoring of Scientific Explanations in NGSS Classroom
arXiv:2604.19754v1 Announce Type: cross 本文書:学生による科学解説の自動スコアリングは、即時で正確なフィードバックの可能性を秘めていますが、ルーブリックカテゴリーにおけるクラスの不均衡は依然として課題となっています。特に、高度な推論を捉えるカテゴリーにおけるこの問題は顕著です。本研究は、NGSS 整合性を有した学習の進行段階に基づいた物理科学の評価に学生回...
Original: arXiv:2604.19754v1 Announce Type: cross Abstract: Automated scoring of students' scientific explanations offers the potential for immediate, accurate feedback, yet class imbalance in rubric categorie...
テキスト埋め込みを用いたドメイン知識ゼロのアルゴリズム選択
Algorithm Selection with Zero Domain Knowledge via Text Embeddings
arXiv:2604.19753v1 Announce Type: cross 抽出: 我々は、手動設計されたインスタンス特徴を事前学習されたテキスト埋め込みで置換する、特徴フリーなアルゴリズム選択のアプローチを提案します。我々の手法、ZeroFolio は 3 つのステップで進めます:生のインスタンスファイルを読み取って通常テキストに変換する、事前学習された埋め込みモデルで埋め込む、そして重み付...
Original: arXiv:2604.19753v1 Announce Type: cross Abstract: We propose a feature-free approach to algorithm selection that replaces hand-crafted instance features with pretrained text embeddings. Our method, Z...
FedSIR:ノイズラベル付きフーダー学習におけるスペクトRAL クライアント識別と再ラベリング
FedSIR: Spectral Client Identification and Relabeling for Federated Learning with Noisy Labels
論文:arXiv:2604.20825v1 発表タイプ:新規 要旨:フーダー学習(FL)は生データを共有せずに協力的なモデル訓練を可能にしますが、分散されたクライアント間に存在するノイズラベルは学習性能を著しく低下させる可能性があります。本稿では、ノイズラベル下での頑健なフーダー学習のための複数段階フレームワークである FedSIR を提案します。既存のアプローチが主にノイズに耐性のある損失関数...
Original: arXiv:2604.20825v1 Announce Type: new Abstract: Federated learning (FL) enables collaborative model training without sharing raw data; however, the presence of noisy labels across distributed clients...
コンテキスト制御サンプルによる生物医学イメージリングにおけるドメインギャップの埋め合わせ
Closing the Domain Gap in Biomedical Imaging by In-Context Control Samples
arXiv:2604.20824v1 Announce Type: new 要約:生物医学イメージリングにおける中心的な課題はバッチ効果(対象の生物学的シグナルとは無関係な体系的な技術的変動)です。これらのバッチ効果は実験の再現性を根本的に損ない、ディープラーニングシステムを新たな実験バッチで失敗させ、実世界での実用を阻害しています。何十年もわたる研究にも関わらず、ディープラーニングモデルにおける...
Original: arXiv:2604.20824v1 Announce Type: new Abstract: The central problem in biomedical imaging are batch effects: systematic technical variations unrelated to the biological signal of interest. These batc...
Stream-CQSA: Flexible Workload Scheduling を通じた Attention 計算における OOM 回避
Stream-CQSA: Avoiding Out-of-Memory in Attention Computation via Flexible Workload Scheduling
arXiv:2604.20819v1 Announce Type: new Abstract: 長文脈大規模言語モデルのスケーラビリティは、正確な自己注意の 2 乗倍メモリコストによって本質的に制限されており、これは現代的なハードウェアにおけるOutOf-Memory(OOM)失敗を引き起こすことが一般的である。既存の手法はメモリ効率を近似的に線形複雑性に改善しているが、クエリ、キー、バリューのテ...
Original: arXiv:2604.20819v1 Announce Type: new Abstract: The scalability of long-context large language models is fundamentally limited by the quadratic memory cost of exact self-attention, which often leads ...
ParetoSlider: 連続報酬制御のための拡散モデルの後訓練
ParetoSlider: Diffusion Models Post-Training for Continuous Reward Control
arXiv:2604.20816v1 発表型: 新しい アブストラクト: 強化学習 (RL) の後訓練が、生成モデルを人間好みに合わせるための標準的アプローチとなりましたが、多くの手法が単一のスカラー報酬に依存しています。複数の基準が存在する場合、既存の「初期スカラー化」のプラクティスは、訓練時に固定的な重み付けの合計に報酬を崩壊させます。これにより、モデルは訓練時に単一のトレードオフ点に固執する...
Original: arXiv:2604.20816v1 Announce Type: new Abstract: Reinforcement Learning (RL) post-training has become the standard for aligning generative models with human preferences, yet most methods rely on a sin...
物理的な制約による不完了な層軌跡から内部氷層厚さの合成
Physics-Conditioned Synthesis of Internal Ice-Layer Thickness for Incomplete Layer Traces
arXiv:2604.20783v1 Announce Type: new Abstract: レーダー画像化された内部氷層は、積雪の堆積と氷のダイナミクスに関する決定的な証拠を提供しますが、レーダーから導き出された層境界観測は、分解能の制限、センサーノイズ、および信号丢失により、しばしば不連続な軌跡を示し、時には完全に欠如した層が存在することがあります。既存の氷層成層図学のグラフベースのモデル...
Original: arXiv:2604.20783v1 Announce Type: new Abstract: Internal ice layers imaged by radar provide key evidence of snow accumulation and ice dynamics, but radar-derived layer boundary observations are often...
ユーザー学習を考慮した効率的なマルチコホート推論:長期効果と寿命価値の A/B テストにおける評価
Efficient Multi-Cohort Inference for Long-Term Effects and Lifetime Value in A/B Testing with User Learning
arXiv:2604.20777v1 Announce Type: new 要約:ストリーミングプラットフォームにおける離脱(チャーン)は莫大な損失をもたらしますが、A/B テストは一般的に、実験の限定的な期間内で観測された結果のみを用いて評価されます。短時間および予測される長期のエンゲージメント指標を両方考慮しても、処理(タレント)がユーザーの定着に及ぼす影響を正しく捉えられない可能性があります...
Original: arXiv:2604.20777v1 Announce Type: new Abstract: In streaming platforms churn is extremely costly, yet A/B tests are typically evaluated using outcomes observed within a limited experimental horizon. ...
機能空間における相対エントロピーの推定:理論と軌道推導への応用
Relative Entropy Estimation in Function Space: Theory and Applications to Trajectory Inference
arXiv:2604.20775v1 Announce Type: new 要約:軌道推導(TI)は、時系列の境界分布のみから独立したサンプリングが観測されるスナップショットデータから、潜在の動的プロセスを復元することを目的としています。シングルセルゲノミクスなどの応用においては、破壊的な測定により有限個の境界分布だけでは空間の法則を特定できず、残りの境界分布の予測が主要で限定的な評価プロトコルと...
Original: arXiv:2604.20775v1 Announce Type: new Abstract: Trajectory Inference (TI) seeks to recover latent dynamical processes from snapshot data, where only independent samples from time-indexed marginals ar...
モバイル自律システムにおけるライフサイクル意識型のフェデレート継続的学習
Lifecycle-Aware Federated Continual Learning in Mobile Autonomous Systems
arXiv:2604.20745v1 Announce Type: new Abstract: フェデレート継続的学習(FCL)は、自律的な車両部隊が、長期ミッションにおける進化する地形タイプに協力的に適応することを可能にします。ただし、現在のアプローチはいくつかの重要な課題に直面しています:1)異なるネットワークレイヤーにおける忘却感受性のばらつきを考慮しない一貫した保護戦略を採用していること...
Original: arXiv:2604.20745v1 Announce Type: new Abstract: Federated continual learning (FCL) allows distributed autonomous fleets to adapt collaboratively to evolving terrain types across extended mission life...
F$^2$LP-AP: 適応的传播核を持つ高速かつ柔軟なラベル-propagation
F\textsuperscript{2}LP-AP: Fast \& Flexible Label Propagation with Adaptive Propagation Kernel
arXiv:2604.20736v1 発表タイプ:new 摘要:半教師付なノード分類は、グラフ機械学習における基礎的なタスクですが、最上流のグラフニューラルネットワーク(GNN)は顕著な計算コストと強いホモフィリア仮定に依存する課題に直面しています。従来の GNN は高価な反復トレーニングとマルチレイヤーメッセージパスを必要とし、一方、既存のトレーニングフリー方法であるラベル-propagatio...
Original: arXiv:2604.20736v1 Announce Type: new Abstract: Semi-supervised node classification is a foundational task in graph machine learning, yet state-of-the-art Graph Neural Networks (GNNs) are hindered by...
シミュレーションに基づく推論を用いた高速なバベシアン機器の状態監視:熱交換器の健康状態への応用
Fast Bayesian equipment condition monitoring via simulation based inference: applications to heat exchanger health
arXiv:2604.20735v1 発表形式:新規 要約:産業機器の正確な状態監視には、不確実性の下で間接的なセンサー測定から潜在的不降解パラメータを推定することが求められています。マルコフ連鎖モンテカルロ法(MCMC)などの従来のバベシアンの手法は確実性の定量化を厳密に実行可能であっても、計算上のボトルネックの重さによりリアルタイムプロセス制御の実用化が困難です。この課題を克服するため、我々...
Original: arXiv:2604.20735v1 Announce Type: new Abstract: Accurate condition monitoring of industrial equipment requires inferring latent degradation parameters from indirect sensor measurements under uncertai...
近未来政策最適化:自己と対話する RLVR 収束を加速する新しいアプローチ
Near-Future Policy Optimization
arXiv:2604.20733v1 Announce Type: new 概要 検証可能な報酬を持つ強化学習 (RLVR) は、現在のトレーニングの核となるレシピとして定着しています。適したオフポリシー軌道をオンポリシー探索に組み込むことは、RLVR の収束速度を加速し、性能の上限を高めることが示されていますが、そのような軌道のソースを見つけることはまだ最大の課題です。既存のミックスポリシー...
Original: arXiv:2604.20733v1 Announce Type: new Abstract: Reinforcement learning with verifiable rewards (RLVR) has become a core post-training recipe. Introducing suitable off-policy trajectories into on-poli...
補完生成トレーニングによるエージェントタスク性能向上
Supplement Generation Training for Enhancing Agentic Task Performance
arXiv:2604.20727v1 発表 タイプ: 新しい内容 要約: エージェントタスク向けの大型基礎モデルのトレーニングは、高い計算コスト、長い反復サイクル、および新モデルの連続的なリリースによる迅速な陳腐化のため、ますます現実的ではありません。すべての新しいタスクやドメインに対して大規模なモデルをポストトレーニングする代わりに、より効率的で持続可能な戦略である補完生成トレーニング(SGT...
Original: arXiv:2604.20727v1 Announce Type: new Abstract: Training large foundation models for agentic tasks is increasingly impractical due to the high computational costs, long iteration cycles, and rapid ob...
階層型シミュレーションに基づく推論のためのトークナイズドフローマッチング
Tokenised Flow Matching for Hierarchical Simulation Based Inference
arXiv:2604.20723v1 Announce Type: new 要旨:シミュレーションに基づく推論 (SBI) の際、シミュレーター評価のコストは実際の運用における重要なボトルネックです。共有された全局パラメータと交換可能なサイトレベルのパラメータ、観測値を持つ階層的な設定において、この構造を効果的に活用してシミュレーション効率を向上させることができます。既存の階層型 SBI アプロー...
Original: arXiv:2604.20723v1 Announce Type: new Abstract: The cost of simulator evaluations is a key practical bottleneck for Simulation Based Inference (SBI). In hierarchical settings with shared global param...