Back to list
Losses that Cook: Structured Recipe Generationのためのトポロジカル最適輸送
Losses that Cook: Topological Optimal Transport for Structured Recipe Generation
Translated: 2026/4/20 11:18:26
Japanese Translation
arXiv:2601.02531v2 Announce Type: replace-cross
本文書では、料理レシピは流暢で事実に基づいたテキストだけでなく、正確な計量・温度・手順の整合性、そして食材の組み合わせも必要とする複雑な手続きであることを示唆します。標準的なトレーニング手法は主にクロスエントロピーに基づき、流暢性のみを重視しています。RECIPE-NLG を発展させる形で、本研究では複数の複合目標を使用し、埋め込み空間における食材リストを点群として表現する新しいトポロジカル損失を提案します。予測された食材と真の食材間の離散度を最小化させることで、標準的な NLG 指標とレシピ固有の指標の両方を用いた評価で、我々の損失関数が食材・アクションレベルの指標を著しく改善していることが確認されました。同時に、Dice 損失は時間・温度の精度において優位を示し、ミキスト損失は数量と時間の面で競争力のあるトレードオフと相乗効果を生み出しています。人間評価分析の結果は、我々のモデルが 62% のケースで好まれることを支持しています。
Original Content
arXiv:2601.02531v2 Announce Type: replace-cross
Abstract: Cooking recipes are complex procedures that require not only a fluent and factual text, but also accurate timing, temperature, and procedural coherence, as well as the correct composition of ingredients. Standard training procedures are primarily based on cross-entropy and focus solely on fluency. Building on RECIPE-NLG, we investigate the use of several composite objectives and present a new topological loss that represents ingredient lists as point clouds in embedding space, minimizing the divergence between predicted and gold ingredients. Using both standard NLG metrics and recipe-specific metrics, we find that our loss significantly improves ingredient- and action-level metrics. Meanwhile, the Dice loss excels in time/temperature precision, and the mixed loss yields competitive trade-offs with synergistic gains in quantity and time. A human preference analysis supports our finding, showing our model is preferred in 62% of the cases.