Back to list
飛行回避記録の不均衡データに対する生成拡張:飛行情報システムにおける多目的最適化フレームワーク
Generative Augmentation of Imbalanced Flight Records for Flight Diversion Prediction: A Multi-objective Optimisation Framework
Translated: 2026/4/24 19:58:04
Japanese Translation
arXiv:2604.20288v1 発表タイプ: 新しい
要約:飛行回避は航空において希少ではあるが高影響力の出来事であり、その予測は安全と運用効率にとって不可欠である。しかし、歴史記録におけるその希少性は、これらを検知する機械学習モデルの学習を妨げている。本研究は、この希少性のギャップに対し、生成モデルが合成的な回避記録を付加することで歴史飛行データを拡張し、モデル訓練を改善し予測精度を向上させるかどうかを調査することで対処する。私たちは、3 つの深層生成モデル(Tabular Variational Autoencoder (TVAE)、Conditional Tabular Generative Adversarial Network (CTGAN)、CopulaGAN)の最適な配置を特定するために、多目的最適化フレームワークを自動ハイパーパラメータ検索と組み合わせ提案した。正規分布の Copula (GC) モデルは統計的な基準として使用された。合成データの品質は、実在性、多様性、運用妥当性、統計的類似性、忠実性、および予測有用性を含む 6 段階の評価フレームワークによって調査された。結果は、最適化されたモデルが非最適化された対照群に比べて顕著に優れていること、そして合成拡張が実データだけで訓練されたモデルに比べて回避予測を大幅に改善することを示した。これらの発見は、稀有な出来事の予測モデリングを進展させるためのハイパーパラメータ最適化生成モデルの有効性を示している。
Original Content
arXiv:2604.20288v1 Announce Type: new
Abstract: Flight diversions are rare but high-impact events in aviation, making their reliable prediction vital for both safety and operational efficiency. However, their scarcity in historical records impedes the training of machine learning models utilised to predict them. This study addresses this scarcity gap by investigating how generative models can augment historical flight data with synthetic diversion records to enhance model training and improve predictive accuracy. We propose a multi-objective optimisation framework coupled with automated hyperparameter search to identify optimal configurations for three deep generative models: Tabular Variational Autoencoder (TVAE), Conditional Tabular Generative Adversarial Network (CTGAN), and CopulaGAN, with the Gaussian Copula (GC) model serving as a statistical baseline. The quality of the synthetic data was examined through a six-stage evaluation framework encompassing realism, diversity, operational validity, statistical similarity, fidelity, and predictive utility. Results show that the optimised models significantly outperform their non-optimised counterparts, and that synthetic augmentation substantially improves diversion prediction compared to models trained solely on real data. These findings demonstrate the effectiveness of hyperparameter-optimised generative models for advancing predictive modelling of rare events in air transportation.