AI能力向上はデータ量に依存、サンプル効率停滞をDwarkesh Podcastが分析
Dwarkesh Podcastは6月8日(現地時間)、人工知能 (AI) の能力向上が、より多くの高品質なデータと、そのデータを開発するための計算資源のスケーリングに主に依存していると報じた。同記事は、AIの知能を特定の領域で流暢かつ適切に機能するために必要なデータ量である「サンプル効率」で定義し、このサンプル効率の点では過去数年間で大きな進展が見られない可能性を指摘している。むしろ、データ分布の劇的な拡大と改善が主な進歩の原動力であると分析した。