Back to list
arxiv_cs_lg 2026年4月24日

IceCube を用いた球面上の中性子子方向のニューラル後方推定:トランスフォーマーエンコードした正規化フローズを用いた手法

Neural posterior estimation of the neutrino direction in IceCube using transformer-encoded normalizing flows on the sphere

Translated: 2026/4/24 20:02:37
icecubeneutrino-astrophysicsnormalizing-flowstransformer-encodersspherical-geometry

Japanese Translation

arXiv:2604.19846v1 Announce Type: cross Abstract: IceCube は地理的南極に位置する、立方キロメートル規模の中性子子検出器です。 IceCube の中性子子からの正確な方向性再構築は、天文観測対象との関連付けにとって不可欠です。本研究では、2 球面上の正規化フローズにマッピングするトランスフォーマーエンコーダーを用いた中性子子方向のニューラル後方推定について議論します。本手法は、IceCube の 2 つの主なイベント形態(軌跡とシャワー)において、従来の B スプラインに基づく確率再構築に比べて大幅に高速でありながら、新しいステート・オブ・ザ・アート(SOTA)の角度分解能を実現します。全スカイのスキャンは数秒で完了し、計算時間が一定であり、後方分布の範囲が角分か全スカイを覆うかに依存しません。我々は、$C^2$-滑らかな有理次数 2 乗スプラインとスケール変換、および回転の組み合わせを用い、トランスフォーマーエンコーダーの出力として一度にパラメータ全体を予測する新規の球面正規化フローズ分布を定義しました。また、素のトランスフォーマーアーキテクチャから逸脱するいくつかの構造的选择を試験的に評価しました。具体的には、テスト時パフォーマンスを向上させるために、二重残差ストリーム、非線形 QKV プロジェクション、および独自のカロスアテンション処理を持つ別々のクラストークンを用いました。100 GeV から 100 PeV までのトレーニングされた全エネルギー範囲において、シャワーおよび軌跡の両方について角度分解能が大幅に向上しました。例えば、100 TeV の投入エネルギーにおいて、透過軌跡については 1.3 倍、シャワーについては 1.7 倍、開始軌跡については 2.5 倍の向上が見られ、B スプラインに基づく従来の確率再構築と比較します。以前、機械学習(ML)の試みは競争的なシャワー分解能を得ることに成功しましたが、これは 100 GeV より高いエネルギーで、確率ベースのミューオン再構築を超える性能を ML ベースの手法が達成した最初の事例です。

Original Content

arXiv:2604.19846v1 Announce Type: cross Abstract: IceCube is a cubic-kilometer-scale neutrino detector located at the geographic South Pole. A precise directional reconstruction of IceCube neutrinos is vital for associations with astronomical objects. In this context, we discuss neural posterior estimation of the neutrino direction via a transformer encoder that maps to a normalizing flow on the 2-sphere. It achieves a new state-of-the-art angular resolution for the two main event morphologies in IceCube - tracks and showers - while being significantly faster than traditional B-spline-based likelihood reconstructions. All-sky scans can be performed within seconds rather than hours, and take constant computation time, regardless of whether the posterior extent is arc-minutes or spans the whole sky. We utilize a combination of $C^2$-smooth rational-quadratic splines, scale transformations and rotations to define a novel spherical normalizing-flow distribution whose parameters are predicted as a whole as the output of the transformer encoder. We test several structural choices diverting from the vanilla transformer architecture. In particular, we find dual residual streams, nonlinear QKV projection and a separate class token with its own cross-attention processing to boost test-time performance. The angular resolution for both showers and tracks improves substantially over the whole trained energy range from 100 GeV to 100 PeV. At 100 TeV deposited energy, for example, the median angular resolution improves by a factor of $1.3$ for throughgoing tracks, by a factor of $1.7$ for showers and by a factor of $2.5$ for starting tracks compared to state-of-the art likelihood reconstructions based on B-splines. While previous machine-learning (ML) efforts have managed to obtain competitive shower resolutions, this is the first time an ML-based method outperforms likelihood-based muon reconstructions above 100 GeV.