Back to list
なぜ全ての LLM が日本文化に魅了されているのか:LLM の隠れた文化的および地域バイアスについて
Why are all LLMs Obsessed with Japanese Culture? On the Hidden Cultural and Regional Biases of LLMs
Translated: 2026/4/24 20:28:38
Japanese Translation
arXiv:2604.21751v1 Announce Type: cross
要約:LLM は文化的なCoverage と能力において限界を示しており、場合によっては西側や英語圏中心的な視点を増幅するといった地域バイアスも現れています。LLM の文化的能力を検証した作品はありましたが、文化的な問いに関する LLM の地域的嗜好に焦点を当てる具体的な作品は存在していません。本論文では、Culture-Related Open Questions(CROQ:文化に関連したオープンな問い)の包括的税別に基づく新たなデータセットを提案します。結果は、以前の研究による文化的バイアスの報告とは異なり、LLM が日本を含む特定の国に対して明確な傾向性を示すことを示しています。さらに、英語などのリソースの多い言語を用いたプロンプト時に、LLM による出力がより多様になり、入力言語が正式言語である国の問いに対して回答する傾向が低くなることも示しました。最後に、文化的バイアスが LLM 学習のどの時点で現れるかを調査し、我々の結果はバイアスがプレトレーニングの段階ではなく、上流下流フィチューニングの最初の明確な段階から現れることを示唆しています。
Original Content
arXiv:2604.21751v1 Announce Type: cross
Abstract: LLMs have been showing limitations when it comes to cultural coverage and competence, and in some cases show regional biases such as amplifying Western and Anglocentric viewpoints. While there have been works analysing the cultural capabilities of LLMs, there has not been specific work on highlighting LLM regional preferences when it comes to cultural-related questions. In this work, we propose a new dataset based on a comprehensive taxonomy of Culture-Related Open Questions (CROQ). The results show that, contrary to previous cultural bias work, LLMs show a clear tendency towards countries such as Japan. Moveover, our results show that when prompting in languages such as English or other high-resource ones, LLMs tend to provide more diverse outputs and show less inclinations towards answering questions highlighting countries for which the input language is an official language. Finally, we also investigate at which point of LLM training this cultural bias emerges, with our results suggesting that the first clear signs appear after supervised fine-tuning, and not during pre-training.