Back to list
TriagerX: 内容および相互作用に基づくランキングを備えたバグトリアージタスクのための Dual Transformers
TriagerX: Dual Transformers for Bug Triaging Tasks with Content and Interaction Based Rankings
Translated: 2026/4/20 11:06:54
Japanese Translation
arXiv:2508.16860v2 公告タイプ:代替
要約:事前学習済み言語モデル(PLM)は、トランスフォーマーベースのアーキテクチャであり、バグトリアージタスクに使用できます。PLM は、統計的特徴(例:TF-IDF、Bag of Words)に依存する従来の機械学習(ML)モデルよりも、トークンの意味をよりよく捉えられます。ただし、PLM はバグレポート内の関連性が低いトークンにまだ注目し、それが効果に影響を与える可能性があります。また、類似のバグに関する開発者の対話履歴を考慮せずに、その推奨事項は最適化されていない可能性があります。これらの限界に対処するために、TriagerX を設計しました。まず、トークンの意味をより信頼性の高い方法で評価するために、Dual Transformers アーキテクチャを活用しました。現在の最前例(SOTA)ベースラインが単一のトランスフォーマーアーキテクチャを使用するのと対照的に、TriagerX は 2 つのトランスフォーマーの推奨事項を集約し、それぞれが最終 3 レイヤーを介して推奨事項を提供します。この設定は候補開発者に対する堅固なコンテンツベースのランキングを生成します。その後、TriagerX は開発者の類似した固定されたバグとの履歴対話を考慮する新しい相互作用ベースのランキング手法を採用することで、このランキングを洗練させます。5 つのデータセットにおいて、TriagerX は SOTA ベースラインを含むすべての 9 つのトランスフォーマーベースの方法を凌駕し、Top-1 および Top-3 開発者推奨の精度を通常 10% 以上向上させました。私たちは大きな業界パートナーと協力し、TriagerX を彼らの開発環境に成功裡に展開しました。パートナーは開発者およびコンポーネントの両方の推奨を必要としており、コンポーネントはチーム割り当てのプロキシとして機能します(これは開発者の交代やチームの変更の状況において特に有用です)。パートナーのデータセットを両方のタスクのために TriagerX に学習させ、コンポーネント推奨では SOTA ベースラインを最大 10% 凌駕し、開発者推奨では最大 54% 凌駕しました。
Original Content
arXiv:2508.16860v2 Announce Type: replace-cross
Abstract: Pretrained Language Models or PLMs are transformer-based architectures that can be used in bug triaging tasks. PLMs can better capture token semantics than traditional Machine Learning (ML) models that rely on statistical features (e.g., TF-IDF, bag of words). However, PLMs may still attend to less relevant tokens in a bug report, which can impact their effectiveness. In addition, the model can be sub-optimal with its recommendations when the interaction history of developers around similar bugs is not taken into account. We designed TriagerX to address these limitations. First, to assess token semantics more reliably, we leverage a dual-transformer architecture. Unlike current state-of-the-art (SOTA) baselines that employ a single transformer architecture, TriagerX collects recommendations from two transformers with each offering recommendations via its last three layers. This setup generates a robust content-based ranking of candidate developers. TriagerX then refines this ranking by employing a novel interaction-based ranking methodology, which considers developers' historical interactions with similar fixed bugs. Across five datasets, TriagerX surpasses all nine transformer-based methods, including SOTA baselines, often improving Top-1 and Top-3 developer recommendation accuracy by over 10%. We worked with our large industry partner to successfully deploy TriagerX in their development environment. The partner required both developer and component recommendations, with components acting as proxies for team assignments-particularly useful in cases of developer turnover or team changes. We trained TriagerX on the partner's dataset for both tasks, and it outperformed SOTA baselines by up to 10% for component recommendations and 54% for developer recommendations.