Back to list
Neural Sabermetrics with World Model: Play-by-play Predictive Modeling with Large Language Model
Neural Sabermetrics with World Model: Play-by-play Predictive Modeling with Large Language Model
Translated: 2026/3/15 13:03:15
Japanese Translation
arXiv:2602.07030v1 Announce Type: new
摘要:古典的なサバメトリクスは、長期にわたる試合の記録を凝縮した統計指標を通じて野球の分析を深く形作ってきました。これらの指標は価格的評価や回顧的分析には極めて有用ですが、ピッチごとの試合の発展を定義する生成モデルを提供していません。既存のアプローチの多くは単一ステップの予測や事後分析に制限されています。本研究では、野球のプレー・バイ・プレーの世界モデルである「Neural Sabermetrics with World Model」を紹介します。私たちは野球の試合を長期的な自動回帰イベントシーケンスとみなし、10 年以上の Major League Baseball (MLB) 追跡データ(700 万を超えるピッチシーケンスと約 30 億トークン)を基に単一の LLM を継続的に事前学習しました。得られたモデルは、統合された枠組み内で試合の進化の多様な側面を予測する能力を持っています。同様の性能を示す従来の基盤モデルと比較し、分布内データおよび分布外データ(ポストシーズン)に対して評価を行いました。単一のバックボーンモデルを使用しながらも、既存の基盤モデルよりも高い性能を達成しており、次の打席における次なるピッチの予測が約 64%、打者のスイング決定が約 78% を正しく予測しています。これにより、LLM がスポーツにおいて効果的な世界モデルとして機能し得ることを示唆しています。
Original Content
arXiv:2602.07030v1 Announce Type: new
Abstract: Classical sabermetrics has profoundly shaped baseball analytics by summarizing long histories of play into compact statistics. While these metrics are invaluable for valuation and retrospective analysis, they do not define a generative model of how baseball games unfold pitch by pitch, leaving most existing approaches limited to single-step prediction or post-hoc analysis. In this work, we present Neural Sabermetrics with World Model, a Large Language Model (LLM) based play-by-play world model for baseball. We cast baseball games as long auto-regressive sequences of events and continuously pretrain a single LLM on more than ten years of Major League Baseball (MLB) tracking data, comprising over seven million pitch sequences and approximately three billion tokens. The resulting model is capable of predicting multiple aspects of game evolution within a unified framework. We evaluate our model on both in-distribution regular-season data and out-of-distribution postseason games and compare against strong neural baselines from prior work. Despite using a single backbone model, our approach outperforms the performance of existing baselines, (1) correctly predicting approximately 64% of next pitches within a plate appearance and (2) 78% of batter swing decisions, suggesting that LLMs can serve as effective world models for sports.