Back to list
生成モデルを用いた合成飛行データ生成
Synthetic Flight Data Generation Using Generative Models
Translated: 2026/4/24 19:58:09
Japanese Translation
arXiv:2604.20293v1 Announce Type: new
要約:航空研究における合成データの採用増加は、データ不足と機密性に関する課題に対する有望な解決策をもたらしています。本研究では、生成モデルが生み出す現実的な合成飛行データの可能性を探り、その質を包括的な 4 つ段階の評価枠組みを通じて評価します。合成飛行データの必要性は、機密性の高い実世界記録の代替品として機能する可能性、および歴史的データセットにおける稀な事象の増強を通じて生じます。これらの強化されたデータセットは、飛行遅延、中止、迂回、ターボアラウンド時間などの重要な事象を予測する機械学習モデルのトレーニングに使用されます。Tabular Variational Autoencoder (TVAE) と Gaussian Copula (GC) という 2 つの生成モデルが、統計的な類似性、忠実性、多様性、および予測的有用性を保つ能力に基づいて比較され、合成飛行情報の生成に適応させられました。結果は、GC が高なる統計的類似性と忠実性を達成するものの、計算コストが大型データセットへの適用性を妨げる一方で、TVAE が大型データを効率的に取り扱い、スケーラブルな合成データ生成を可能にすることを示しています。これらの発見は、合成データが、実データでトレーニングされたモデルと同様の精度で飛行遅延予測モデルをサポートできることを示しています。これらの結果は、予測モデリングの航空輸送分野における向上を利用するために合成飛行データを活用する道を開いています。
Original Content
arXiv:2604.20293v1 Announce Type: new
Abstract: The increasing adoption of synthetic data in aviation research offers a promising solution to data scarcity and confidentiality challenges. This study investigates the potential of generative models to produce realistic synthetic flight data and evaluates their quality through a comprehensive four-stage assessment framework. The need for synthetic flight data arises from their potential to serve as an alternative to confidential real-world records and to augment rare events in historical datasets. These enhanced datasets can then be used to train machine learning models that predict critical events, such as flight delays, cancellations, diversions, and turnaround times. Two generative models, Tabular Variational Autoencoder (TVAE) and Gaussian Copula (GC), are adapted to generate synthetic flight information and compared based on their ability to preserve statistical similarity, fidelity, diversity, and predictive utility. Results indicate that while GC achieves higher statistical similarity and fidelity, its computational cost hinders its applicability to large datasets. In contrast, TVAE efficiently handles large datasets and enables scalable synthetic data generation. The findings demonstrate that synthetic data can support flight delay prediction models with accuracy comparable to those trained on real data. These results pave the way for leveraging synthetic flight data to enhance predictive modeling in air transportation.