Back to list
黒箱生成ソフトウェアからの定期的に現れるバグを抽出する
Extracting Recurring Vulnerabilities from Black-Box LLM-Generated Software
Translated: 2026/2/14 8:18:38
Japanese Translation
arXiv:2602.04894v2 投稿タイプ:交換クロス
概要:LLMsはコード生成に広く使用されはじめていますが、その出力はしばしば前方のテンプレートを-followし、予測可能なバグを促進するかもしれません。我々は extit{後方バグersistent性} リンク生成されたソフトウェアに注目し、両側面表 (FSTab) を導入しました。 1つ目の要素では、黒箱攻撃が既存の前方の機能と知る元のロジックライム(RLL)を用いて、後方のバグを予測できるようになります無償のバックエンドのコードとソースコードへのアクセスはありません。この2つ目のFSTabは一覧モデルにとって評価し、個が生成する同様のバグがどのような程度一致しているかを数字化します特定のモデル間で、プリンシピアルの言葉を保存しながらプログラムの変更、関係性とアプリケーション範囲。我々はFSTabは、ステート・オブ・ハンドス・コードRLL、アリビューティー・GPT-5.2、クラウジ4.。5Opus、メーターズ-3プロパーコーデイングに評価しました、様々なアプリケーション範囲の異なる個体。結果として強力な跨領域伝播が存在することが露見されるとその目的の個体は訓練から排除されましたFSTabは、内部ツール(クラウド4.5Opus)について最多94%の攻撃成功と最高93%にバグカバー率を達成します。これらの結果はLLM生成ソフトウェアに関する無尽期の攻撃領域を明らかにするだけでなく、コード生成のセキュリティリスクも示唆しています。私たちはコードは以下のURLで公開: https://anonymous.4open.science/r/FSTab-024E。
Original Content
arXiv:2602.04894v2 Announce Type: replace-cross
Abstract: LLMs are increasingly used for code generation, but their outputs often follow recurring templates that can induce predictable vulnerabilities. We study \emph{vulnerability persistence} in LLM-generated software and introduce \emph{Feature--Security Table (FSTab)} with two components. First, FSTab enables a black-box attack that predicts likely backend vulnerabilities from observable frontend features and knowledge of the source LLM, without access to backend code or source code. Second, FSTab provides a model-centric evaluation that quantifies how consistently a given model reproduces the same vulnerabilities across programs, semantics-preserving rephrasings, and application domains. We evaluate FSTab on state-of-the-art code LLMs, including GPT-5.2, Claude-4.5 Opus, and Gemini-3 Pro, across diverse application domains. Our results show strong cross-domain transfer: even when the target domain is excluded from training, FSTab achieves up to 94\% attack success and 93\% vulnerability coverage on Internal Tools (Claude-4.5 Opus). These findings expose an underexplored attack surface in LLM-generated software and highlight the security risks of code generation. Our code is available at: https://anonymous.4open.science/r/FSTab-024E.