Back to list
コーディングintelligenceのカスタムを理解するための方向性
Towards an Understanding of Context Utilization in Code Intelligence
Translated: 2026/2/14 7:13:46
Japanese Translation
コード認識はソフトウェアエンジニアリングにおける最近進化している分野で、データロードに関わるさまざまなタスクに対する効果と効率向上を目指しています。これまでの研究では、源コードそのものに与えられた基本的な元のタスク入力(つまり、スコープ)を超えた周囲の情報を取り込んでより高いパフォーマンスを出す方法があります。これらの周辺信号は、APIドキュメントや抽象表現Syntax Treesなどのさまざまなソースから直にまたは間接で取得できます。コーディング認識にカスタムを使用している関連学術的な興味が高まっていますが、そのような情報についての systematic 調查には不足がありました。このギャップを解決するためには、2007年9月と2024年の8月までに146件以上の対象研究の文献レビューを実施します。私たちの調査により、以下の四つの主要貢献が生まれました。1)研究状況についての量的分析、出版トレンドや場所などに関するものも含まれます。2)コーディング認識に使用される周辺タイプの新しい分類。3) 異なるコーディング認識タスクにおけるカスタム統合戦略に対するTask-oriented 調査。4) コーダーコンテキストへの知識評価方法についての批判的評価を含むためです。これらの結果から、現在行われているコード認識システムでカスタム的な使用法に直面している基礎的な課題と、これらの課題に対してもってより革新的な研究パスを特定しました
Original Content
arXiv:2504.08734v2 Announce Type: replace-cross
Abstract: Code intelligence is an emerging domain in software engineering, aiming to improve the effectiveness and efficiency of various code-related tasks. Recent research suggests that incorporating contextual information beyond the basic original task inputs (i.e., source code) can substantially enhance model performance. Such contextual signals may be obtained directly or indirectly from sources such as API documentation or intermediate representations like abstract syntax trees can significantly improve the effectiveness of code intelligence. Despite growing academic interest, there is a lack of systematic analysis of context in code intelligence. To address this gap, we conduct an extensive literature review of 146 relevant studies published between September 2007 and August 2024. Our investigation yields four main contributions. (1) A quantitative analysis of the research landscape, including publication trends, venues, and the explored domains; (2) A novel taxonomy of context types used in code intelligence; (3) A task-oriented analysis investigating context integration strategies across diverse code intelligence tasks; (4) A critical evaluation of evaluation methodologies for context-aware methods. Based on these findings, we identify fundamental challenges in context utilization in current code intelligence systems and propose a research roadmap that outlines key opportunities for future research.