現代AIツールでAlphaGo再現ジャン氏が手法と課題を詳説

Dwarkesh Podcastは2026年5月15日(現地時間)、1X TechnologiesのAI担当副社長であるエリック・ジャン氏が、現代のAIツールを用いて囲碁AI「AlphaGo」をゼロから構築する方法を解説したと報じた。同氏は、探索、経験からの学習、自己対戦という知能の根幹をなす要素を最も明確に示す事例としてこのプロジェクトを位置づけている。DeepMindの研究チームが数百万ドルと膨大な計算資源を投じて開発したAlphaGoが、現代のLLMコーディング技術と数千ドル相当の計算資源で再現可能になったと指摘した。

ジャン氏は、2014年から2016年にかけて、AlphaGoが囲碁という深い探索が困難な問題に対しディープラーニングを適用してブレークスルーを起こしたことが、自身がAI分野へ進む決定的なきっかけとなったと回顧した。特に、10層のニューラルネットワークがゲームツリーの深いシミュレーションコストを償却するメカニズムについて、長年にわたり深い関心を抱いていたという。

囲碁は、黒と白の石を交互に置き、最終的により多くの領土を占めることを目的とするシンプルなルールながらも奥深いゲームである。AIの学習においては、一般的にTromp-Taylorルールが採用されている。2020年には、Jane StreetのDavid Wu氏による「KataGo」がオープンソースプロジェクトとして公開され、その成果として強力な囲碁AIの訓練に必要な計算コストを40分の1に削減したと広く知られている。現在、このKataGoは多くの囲碁プレイヤーにとって、AIとの対戦や研究に不可欠なツールとして活用されている。

ジャン氏は、AlphaGoで用いられたモンテカルロ木探索（MCTS）の手法が、LLM（大規模言語モデル）における強化学習（RL）のクレジット割り当て問題を回避できる点で、人間が学習するプロセスに非常に近いと見解を示した。さらに、LLMがAI研究の特定の側面、例えば実験の設計、実装、実行、さらには複雑なハイパーパラメータの最適化といった作業を大幅に自動化する能力について高く評価した。その一方で、次に探求すべき根本的な問いの選択や、研究が行き詰まった状況から脱却するための創造的な思考といった、より高次の研究活動においては、LLMが依然として明確な課題を抱えていることを率直に指摘した。現代のAIツールがもたらす可能性と限界の両面を深く洞察する講演となった。

参考: Dwarkesh Podcast — 2026年5月9日 01:38 (JST)