Back to list
arxiv_cs_ai 2026年2月10日

専門知識の注入による法廷判決要約における利点:英語とヒンドゥー語での邦訳インド裁判事判決を例とした調査

Advantages of Domain Knowledge Injection for Legal Document Summarization: A Case Study on Summarizing Indian Court Judgments in English and Hindi

Translated: 2026/3/7 12:32:06
legal-languagessummarization-methodscourt-judgments-text-analysis

Japanese Translation

インドの法廷判決を要約することは、複雑な言語や非構造化された文書の特有の難しさだけでなく、また法律文が作成されるための英語(多く使われる言語である)に理解できない多くのインド人の中に存在するための解釈を必要としているという複雑さからも複雑です。 これには、この研究は目的があります。 大規模な法廷文カタログを使った継続的訓練により専門的な法による分離したエンコーダーを使用して抽出的ニューラル要約モデルの向上を図り、さらに法のドメイン情報の注入によるジェネリクモデル(含む大規模モデル)とを探索することにより。 場合は統計的に証明された改善点が存在し、英語から英語へ、そして英語からヒンドゥー語へ向けてインド法廷文に関する要約が可能です。英語の標準評価指標、事実的一貫性指標と法のドメイン特定な指標を利用しました。これらの改善は専門家によって validated され続けていますので、私たちのアプローチの有効的な証明となっています。

Original Content

arXiv:2602.07382v1 Announce Type: cross Abstract: Summarizing Indian legal court judgments is a complex task not only due to the intricate language and unstructured nature of the legal texts, but also since a large section of the Indian population does not understand the complex English in which legal text is written, thus requiring summaries in Indian languages. In this study, we aim to improve the summarization of Indian legal text to generate summaries in both English and Hindi (the most widely spoken Indian language), by injecting domain knowledge into diverse summarization models. We propose a framework to enhance extractive neural summarization models by incorporating domain-specific pre-trained encoders tailored for legal texts. Further, we explore the injection of legal domain knowledge into generative models (including Large Language Models) through continual pre-training on large legal corpora in English and Hindi. Our proposed approaches achieve statistically significant improvements in both English-to-English and English-to-Hindi Indian legal document summarization, as measured by standard evaluation metrics, factual consistency metrics, and legal domain-specific metrics. Furthermore, these improvements are validated through domain experts, demonstrating the effectiveness of our approaches.