大規模VLMのPicbreeder再現、人間との質的差異を指摘

サム・アール氏らは4月1日(現地時間)、大規模なVision Language Models (VLM) を活用し、人間主導のオープンエンドな探求システム「Picbreeder」を再現した研究結果を発表した。この研究は、人間のユーザーをAIエージェントに置き換えることで、科学、技術、創造的生産におけるAIの新たな形式生成能力を検証したもの。結果として、システムが生成した出力は、過去の人間のベースラインと比較して明確な質的差異を示すことが報告された。

この研究は、AI駆動型アシスタントを通じた科学、技術、創造的生産プロセスの自動化を目指す、産業界および学術界の広範な取り組みの中で実施された。これらのプロセスにおいて、人間が本質的に有する特性は、際限なく新しい意味のある形式を生み出す能力、すなわちオープンエンド性(open-endedness)とされている。

研究チームは、大規模VLMを利用してPicbreederシステムを複製し、人間のユーザーの役割をAIエージェントに代替させたシステムを構築した。この複製システムが生成した出力と、これまでの人間のベースラインの間に、質的な違いが明確に観察されたと報告されている。この質的差異を具体的に特徴付けるため、研究では系統発生的複雑性、視覚的および意味的顕著性、新規性といった多角的な指標が分析に用いられた。

観察された差異の原因を特定するため、研究チームは複数の要因を検証した。実験では、エージェントの選択プロセスへの探索的ノイズの追加、エージェント間の行動多様性の確保、および過去の行動を記憶する形での物語的運動量(narrative momentum)の導入が試みられた。しかし、これらの介入策を講じた後も、人間が示すようなオープンエンド性の再現には至らなかったと報告されている。

本研究は、AIが人間の創造的な探求プロセスをどの程度模倣し、あるいは拡張できるかという問いに新たな視点を提供する。AIエージェントが人間の能力に匹敵、あるいは凌駕する形で「際限なく新しい意味のある形式」を生み出すためには、さらなる研究と技術的進歩が求められることを示唆している。この研究のコードは一般に公開されており、本研究はGECCO 2026での発表が予定されている。

参考: arXiv cs.AI — 2026年5月26日 13:00 (JST)