Replit、大規模AIエージェント評価システム「ViBench」導入
Replit (リプリット) は2026年6月23日(現地時間)、開発環境「Replit Agent (リプリット・エージェント)」の評価と改善を大規模に実行する新たなアプローチを発表した。ユーザーが自然言語で記述したアイデアを機能するアプリケーションに変換する同エージェントの性能を測るため、従来の単一スコア評価から、より実践的な評価手法へと移行。オフラインのエンドツーエンド評価ツールViBench (ヴァイベンチ) や本番環境でのA/Bテストなどを統合したシステムを導入する。