Back to list
arxiv_cs_ai 2026年2月10日

ディベートは時間効率的である

Debate is efficient with your time

Translated: 2026/3/7 10:16:18

Japanese Translation

アリーヴXIV:2602。08630 v1 新しい発表型:新しいです。 この投稿はAIの安全を図るディベートが、二つの競合するモデルを使用して、人力の裁判官によって複雑な計算タスクを確認し、検証することができますという点を宣布しています。以前の研究は、ディベートで解決できる問題について原則的にどのようなことができるかを確立しました、しかし人間の監視の実際的なコストについて分析しませんでした:裁判官がディベートのトランスクリプトに対して発する必要のある質問は何個ですか?我々は「Debate クエリ コmplex性」(DQC)を導入しました、これは検証者が正しく結論を下すためには、ディベートで必要な最も少ないビット数です(解釈します。我々は驚くべきように、PSPACE/ポリ(the ディスセーションで効率的に解決できる問題のクラス) がo (n)問い合わせを正しく決定可能な函数の(class を精確に描画したのでした。この描写はディベートがあまりも問い合わせ効果的であることを物語っています:非常に複雑な問題であっても、 logarithmic 監視が十分です。我々も関連性があるようにして関係を特定することが可能ですの必要条件であるo(logn)の問い合わせを持つ全ての入力ビットに依存する函數と omega (logn)の問い合わせを持つ全オキュラス関数を求めています。興味深いことに、この最後の結果は機能によってサイズが s に計算されたディベートに関する問い合わせデッキ(DQC(f) ≤ log(s) + 3 )に新たなシーケンシャルの下限を導くことを表明し、これは議論の問い合わせ複雑性と中央な質問から連絡しますカーティスの複雑性。

Original Content

arXiv:2602.08630v1 Announce Type: new Abstract: AI safety via debate uses two competing models to help a human judge verify complex computational tasks. Previous work has established what problems debate can solve in principle, but has not analysed the practical cost of human oversight: how many queries must the judge make to the debate transcript? We introduce Debate Query Complexity}(DQC), the minimum number of bits a verifier must inspect to correctly decide a debate. Surprisingly, we find that PSPACE/poly (the class of problems which debate can efficiently decide) is precisely the class of functions decidable with O(log n) queries. This characterisation shows that debate is remarkably query-efficient: even for highly complex problems, logarithmic oversight suffices. We also establish that functions depending on all their input bits require Omega(log n) queries, and that any function computable by a circuit of size s satisfies DQC(f) <= log(s) + 3. Interestingly, this last result implies that proving DQC lower bounds of log(n) + 6 for languages in P would yield new circuit lower bounds, connecting debate query complexity to central questions in circuit complexity.