arena.aiは2026年6月(現地時間)、大規模言語モデル(LLM)のテキストカテゴリにおけるEloランキング最新版を公開した。このランキングは、テキスト生成タスクにおける様々なAIモデルのパフォーマンスを評価するもので、Anthropic のclaude-fable-5が1510のスコアで首位を獲得した。評価には6,820,793票が投じられ、366のモデルが対象となっている。

最新のリーダーボードでは、Anthropic のClaudeシリーズが上位を占めた。claude-fable-5が1510 Eloで1位となり、claude-opus-4-6-thinkingが1504 Eloで2位、claude-opus-4-7-thinkingが1502 Eloで3位と続いた。claude-opus-4-6が1498 Eloで4位、claude-opus-4-7が1492 Eloで5位となり、トップ5を独占している。

Meta のmuse-sparkは1487 Eloで6位、Googleのgemini-3.1-pro-previewも同じく1487 Eloで6位タイにランクインした。Googleのgemini-3-proは1486 Eloで8位タイに位置している。

OpenAIのgpt-5.5-highは1481 Eloで10位、gpt-5.4-highは1479 Eloで11位に入った。xAI のgrok-4.20-beta1は1474 Eloで17位に登場している。その他、アリババ (Alibaba)、ゼットエーアイ (Z.ai)、シャオミ (Xiaomi)、ムーンショット (Moonshot)、バイドゥ (Baidu)、バイトダンス (Bytedance)、ミニマックス (MiniMax)、ミートゥアン (Meituan)、ディープシーク (DeepSeek)などのモデルもランキングに名を連ねている。


参考: arena.ai — 2026年6月13日 09:00 (JST)

この記事をシェア
X はてブ LinkedIn