Hugging Face Blogが2026年6月5日(現地時間)付けで報じたところによると、同社は30億パラメータモデル「Qwen2.5-3B」を用いたマルチエージェント経済シミュレーション「Thousand Token Wood」を開発した。これは、少数のAIエージェントがリアルタイムで取引を行う仮想経済システムであり、同社の「Build Small Hackathon」におけるフィールドレポートとして公開された。
Thousand Token Wood(サウザンド・トークン・ウッド)は、5匹の森林動物エージェントが5種類の物品を小石と交換し、取引、貯蓄、そしてパニック状態になる小さな経済を構築する。シミュレーションはvLLMをModal上で稼働させ、Gradioアプリをインターフェースとして提供する。開発者は、30億パラメータモデルが信頼性の高いフォーマット生成器である一方で、推論能力は信頼性に欠けるとの見方を示した。
この課題に対し、プロンプトの改善や厳密な指示、一つWorked Exampleを提供することで、エージェントの意思決定品質を向上させた。システム設計では、初期のシミュレーションが無行動に陥った反省から、意図的に希少性を導入した。これには、食料の多様性制限、腐敗による食料の売却強制、そして冬の薪不足といったメカニズムが含まれる。特に、冬の燃料危機は薪の需要を高め、薪製造者が富を築く要因となった。
さらに、市場の歴史的エピソードを「Wood Legend」として再解釈し、シミュレーションに組み込んだ。例えば、Run on Oona’s Hoardの取り付け騒ぎ伝説は、オオコノハズクが貯蔵品を清算し、ハニー価格が10から3へ暴落する実際の市場変動を引き起こした。価格は各ラウンド後の需給残高に応じて変動するように調整され、希少時にはトレンドが発生し、バランスの取れた取引では安定する。
15ターンのシミュレーション実行では、全てのAPIコールで100%有効なJSONアクションが生成され、ターンあたり3〜9回の取引が継続した。ハニー価格は取り付け騒ぎ伝説中に10から3へ下落し、冬の希少性により薪価格は4から7へ上昇した。富の格差(Gini係数)は0.14から0.38へ拡大し、薪製造者が最も裕福になり、貯蔵者は破産した。すべての動きの背後にある推論は、公開されているtraces datasetで確認できる。
参考: Hugging Face Blog (アーカイブ) — 2026年6月5日 22:02 (JST)
原文ハイライト"a 3B model is a reliable format generator and an unreliable reasoner"