Back to list
小代理群体是数字健康未来的可能性
Small Agent Group is the Future of Digital Health
Translated: 2026/3/7 9:46:29
Japanese Translation
デジタル健康管理の急速な採用は、大言語モデル (LLMs) の導入が進んでおり、「スケーリング・ファースト」の考え方により推奨されていました。つまり、アルゴリズムの大きさとデータが診療所で効果を高めるという考え込みでした。しかし、現場での実際の需要は単に有効性だけでなく、信頼性も考慮する必要があります。 また、医療決定作業は専門家間協力によるものであることから、そのモノリスな「スケーリング」のモデルを否定し、小規模代理群体(SAG)がどう働きかけるかについて疑問を投げかけました。小規模グループ化で分担された理由、分析データに基づく根拠と批判的な批判作業が共同検討プロセスを通じて行われることによって、知識の集積が促進されます。 そのデジタル健康的使用価値を評価するために、さまざまな医療指標を使用した詳細な評価を行いました。これにより、SGは単独の巨大モデルよりも優れた性能を達成し、もしどけない最適化またはリカバリと増加により補強される場合でも同様に。これらの結果は、SGが効果,信頼性と導入効率のバランスを取るための新たなプロセスとしてモデルパラーメターコストを置き換える可能性があることを示唆しました。全体的にはデジタル健康管理に対応するためのサブスケーリシアルソリューションであり、この作業が効果,信頼性と導入エフィシエンシーにおいてバランスを取っています。
Original Content
arXiv:2602.08013v1 Announce Type: new
Abstract: The rapid adoption of large language models (LLMs) in digital health has been driven by a "scaling-first" philosophy, i.e., the assumption that clinical intelligence increases with model size and data. However, real-world clinical needs include not only effectiveness, but also reliability and reasonable deployment cost. Since clinical decision-making is inherently collaborative, we challenge the monolithic scaling paradigm and ask whether a Small Agent Group (SAG) can support better clinical reasoning. SAG shifts from single-model intelligence to collective expertise by distributing reasoning, evidence-based analysis, and critical audit through a collaborative deliberation process. To assess the clinical utility of SAG, we conduct extensive evaluations using diverse clinical metrics spanning effectiveness, reliability, and deployment cost. Our results show that SAG achieves superior performance compared to a single giant model, both with and without additional optimization or retrieval-augmented generation. These findings suggest that the synergistic reasoning represented by SAG can substitute for model parameter growth in clinical settings. Overall, SAG offers a scalable solution to digital health that better balances effectiveness, reliability, and deployment efficiency.