Back to list
arxiv_cs_ai 2026年2月10日

法律分野の長い文脈からの長形式の質問回答

Long-Context Long-Form Question Answering for Legal Domain

Translated: 2026/3/7 12:22:41
machine-learningnatural-language-processingcourt-systemtax-law

Japanese Translation

法的文書には複雑な文書レイアウト、多重にネストされたセクション、長い注脚が含まれており、さらに専門的な言語的装飾を使用して如実性と権威を確保します。これらの特性は法律文書への質問回答のチャレンジとなります。特に、答えを複数ページで説明するために意図的に長文の情報が必要であり、それが長い文脈を持つ際にますます困難です。 この研究では、長期間の文脈に関する質問回答への課題における長い文章答案を解決するためのアプローチを提案しています。我々は(a)ドメイン固有の語彙を解釈することで元の文書で適切な検索が可能になります。(b)複雑な文書レイアウトを解析し、セクションと注脚を分離し、適切に結びつけます。(c)詳細な答えを生成します。我々は記録に基づいたカバー率という評価指標を導入しました。これはユーザが簡単に記録性能について評価できるようになります。我々の研究では、法学者や企業税関係者が専門知識を持つ人材から質問と応答を構築した質問と答えのセットを作成し、本格的な実験と無効性検討を行いました。これらの結果が提案されたシステムのユーザビリティと特長についての証明です。

Original Content

arXiv:2602.07190v1 Announce Type: cross Abstract: Legal documents have complex document layouts involving multiple nested sections, lengthy footnotes and further use specialized linguistic devices like intricate syntax and domain-specific vocabulary to ensure precision and authority. These inherent characteristics of legal documents make question answering challenging, and particularly so when the answer to the question spans several pages (i.e. requires long-context) and is required to be comprehensive (i.e. a long-form answer). In this paper, we address the challenges of long-context question answering in context of long-form answers given the idiosyncrasies of legal documents. We propose a question answering system that can (a) deconstruct domain-specific vocabulary for better retrieval from source documents, (b) parse complex document layouts while isolating sections and footnotes and linking them appropriately, (c) generate comprehensive answers using precise domain-specific vocabulary. We also introduce a coverage metric that classifies the performance into recall-based coverage categories allowing human users to evaluate the recall with ease. We curate a QA dataset by leveraging the expertise of professionals from fields such as law and corporate tax. Through comprehensive experiments and ablation studies, we demonstrate the usability and merit of the proposed system.