Back to list
私、全ての AI エレメンタリー・リーダーボードの自動更新アーカイブを構築しました
I Built an Auto-Updating Archive of Every AI Arena Leaderboard
Translated: 2026/3/21 7:01:17
Japanese Translation
Arena AI(元 LMSYS Chatbot Arena)は AI モデルランク付けのゴールドスタンダードですが、公開 API もなく、履歴データもありません。
そこで私は、arena-ai-leaderboards という GitHub リポジトリを作成しました。このリポジトリは、Arena AI の全てのリーダーボードを構造化された JSON 形式で、毎日自動的に取得します。
GitHub Actions ワークフローは毎日実行され、arena.ai から全てのリーダーボードカテゴリを自動的に発見し、完全なモデルランク付けを取得、構造化された JSON にパース、スキーマに対して検証し、data/{YYYY-MM-DD}/にコミットします。
固定されたカテゴリリストはありません。Arena AI が新しいリーダーボードを追加した際も、自動的に拾われます。
テキスト(LLM)、コード、ビジョン、テキストから画像へ、テキストから動画へ、画像から動画へ、画像編集、ドキュメント、検索、動画編集。
各モデルには、ランク、名前、ベンダー、ライセンスタイプ、ELO スコア、信頼区間、投票数が含まれています。
無料、認証不要。ホスト先は api.wulong.dev です:
# 全てのリーダーボードをリスト化
curl https://api.wulong.dev/arena-ai-leaderboards/v1/leaderboards
# LLM ランキングを取得
curl https://api.wulong.dev/arena-ai-leaderboards/v1/leaderboard?name=text
# 特定の日付を取得
curl https://api.wulong.dev/arena-ai-leaderboards/v1/leaderboard?name=text-to-video\&date=2026-03-21
curl https://raw.githubusercontent.com/oolong-tea-2026/arena-ai-leaderboards/main/data/latest.json
import requests
text = requests.get(
"https://api.wulong.dev/arena-ai-leaderboards/v1/leaderboard?name=text"
).json()
for m in text["models"][:10]:
print(f"#{m["rank"]} {m["model"]} ({m["vendor"]}) — ELO {m["score"]}")
Arena AI は即席の確認には有用ですが、トレンド分析、自動化された監視、または研究には無用です。API も、履歴データもありません。このリポジトリはそれを修正しました。
⭐ 有用であればリポジトリをスターしてください!
Original Content
Arena AI (formerly LMSYS Chatbot Arena) is the gold standard for AI model rankings. But it has no public API and no historical data.
So I built arena-ai-leaderboards — a GitHub repo that auto-fetches all 10 Arena AI leaderboards daily into structured JSON.
A GitHub Actions workflow runs daily, auto-discovers all leaderboard categories from arena.ai, fetches full model rankings, parses them into structured JSON, validates against a schema, and commits to data/{YYYY-MM-DD}/.
No hardcoded category list — when Arena AI adds a new leaderboard, it gets picked up automatically.
Text (LLM), Code, Vision, Text-to-Image, Text-to-Video, Image-to-Video, Image Edit, Document, Search, Video Edit.
Every model includes: rank, name, vendor, license type, ELO score, confidence interval, vote count.
Free, no auth. Hosted at api.wulong.dev:
# List all leaderboards
curl https://api.wulong.dev/arena-ai-leaderboards/v1/leaderboards
# Get LLM rankings
curl https://api.wulong.dev/arena-ai-leaderboards/v1/leaderboard?name=text
# Get a specific date
curl https://api.wulong.dev/arena-ai-leaderboards/v1/leaderboard?name=text-to-video\&date=2026-03-21
curl https://raw.githubusercontent.com/oolong-tea-2026/arena-ai-leaderboards/main/data/latest.json
import requests
text = requests.get(
"https://api.wulong.dev/arena-ai-leaderboards/v1/leaderboard?name=text"
).json()
for m in text["models"][:10]:
print(f"#{m["rank"]} {m["model"]} ({m["vendor"]}) — ELO {m["score"]}")
Arena AI is great for a quick glance but useless for trend analysis, automated monitoring, or research. No API, no historical data. This repo fixes that.
⭐ Star the repo if useful!