リサーチ・論文

macOS向け新ベンチマーク「MacArena」公開、CUA評価の課題解決へ

ヴィクター・ミューリン (Victor Muryn) 氏らの研究チームは6月4日(現地時間)、macOS環境でコンピュータ使用エージェント (Computer-use agents: CUAs) を評価するための新しいベンチマーク「MacArena」を導入したと発表した。同日付けで学術論文プレプリントサーバarXiv cs.LGに報じられた。既存のmacOS向けベンチマークが対応アプリケーションやタスク範囲が限定的であり、Apple Siliconとの互換性がないといった課題を解決し、より包括的な評価基準を提示する。

ベンダー・製品

【速報】Google I/O 2026で主要な発表12件を公開

Googleは2026年5月27日(現地時間)、年次開発者会議Google I/O 2026において、主要な発表を12件行った。これには、新しいモデルであるGemini OmniおよびGemini 3.5 Flashの導入、検索機能の更新などが含まれる。同社は、様々な入力からコンテンツを生成する技術や、日常のタスクを支援するプロダクトの更新を発表した。

ベンダー・製品

【速報】Vercel CLI、実験的なネイティブバイナリの提供を開始

Vercelは2026年5月26日(現地時間)、Vercel CLI向けの実験的なネイティブバイナリの提供を開始した。これにより、CLIの起動が高速化され、セキュリティが強化され、Node.jsランタイムへの依存が不要になる。このバイナリはmacOS、Linux、Windowsのx64およびarm64アーキテクチャに対応する。

ベンダー・製品

OpenAI、ChatGPTモバイルアプリにCodexプレビューを展開

OpenAIは2026年5月16日(現地時間)、ChatGPTモバイルアプリにおいて、コード支援ツール「Codex」のプレビュー版提供を開始しました。これにより、ユーザーはスマートフォンから進行中のコーディング作業に接続し、スレッドの開始・継続、質問への回答、アクションの承認、Codexが検出した内容のレビューなどが可能になります。この機能拡張には、macOSホストからのリモートアクセス、ライブコンテキストのロード機能が含まれています。