Back to list
混動機 Markov ゲームにおける利他主義と公平な目標
Altruism and Fair Objective in Mixed-Motive Markov games
Translated: 2026/3/15 8:03:33
Japanese Translation
arXiv:2602.08389v1 告知 タイプ:横断
要旨:協力は社会的生存にとって基本的であり、集団的繁栄を求めた異質な集団内に構造を創出することを可能にする。しかし、個人はグループの協力の恩恵を受けながら関連するコストを負担しないように逸脱する傾向にあり、その結果不公平な状況が生まれる。ゲーム理論において、社会的ジレンマとは個人の利益と集合的結果の間のこの二律背反を指す。マulti-Agent 協働において最も支配的なアプローチは、効率的であるが非常に不平等な結果を生成する功利主義的福利である。この論文では、標準的な功利主義的目标を代替比例公平(Proportional Fairness)にすることで、より公平な協働を促進するための新しい枠組みを提案する。各エージェントに対して、個別の対数収益空間上で定義される公平利他主義的効用を導入し、クラシックな社会的ジレンマにおける協働を保証するために必要な解析的条件を導出した。続いて、私たちは公平な Markov ゲームを定義し、公平な Actor-Critic アルゴリズムを導入して公平なポリシーを学習する。最後に、我々の方法を様々な社会的ジレンマ環境で評価した。
Original Content
arXiv:2602.08389v1 Announce Type: cross
Abstract: Cooperation is fundamental for society's viability, as it enables the emergence of structure within heterogeneous groups that seek collective well-being. However, individuals are inclined to defect in order to benefit from the group's cooperation without contributing the associated costs, thus leading to unfair situations. In game theory, social dilemmas entail this dichotomy between individual interest and collective outcome. The most dominant approach to multi-agent cooperation is the utilitarian welfare which can produce efficient highly inequitable outcomes. This paper proposes a novel framework to foster fairer cooperation by replacing the standard utilitarian objective with Proportional Fairness. We introduce a fair altruistic utility for each agent, defined on the individual log-payoff space and derive the analytical conditions required to ensure cooperation in classic social dilemmas. We then extend this framework to sequential settings by defining a Fair Markov Game and deriving novel fair Actor-Critic algorithms to learn fair policies. Finally, we evaluate our method in various social dilemma environments.