リサーチ・論文

arXiv、マルチモーダルAIエージェント「Syll」発表 個人自動化を強化

科学論文公開サイト「arXiv cs.AI」は2026年5月28日(現地時間)、複数のインターフェースを横断して動作するオープンソースのマルチモーダルエージェントハーネス「Syll」を発表した。Syllは、API、シェル、ウェブインターフェース、デスクトップGUIといった多様なコンピューター環境でのパーソナルAIエージェント運用を可能にする。既存の自動化システムが単一インターフェースに特化し、ユーザーの教育や監査性が限られているという課題に対し、より柔軟な解決策を提示する狙いがある。

ベンダー・製品

【速報】Vercel、skills.sh APIの提供を開始

Vercelは2026年6月4日(現地時間)、skills.sh APIが利用可能になったと発表した。開発者はプロジェクトのVercel OIDCトークンを用いて認証し、オープンソースエコシステムから60万件を超えるスキル情報をクエリできる。スキルの検索、詳細情報の取得、セキュリティ監査の確認などが可能となる。

ベンダー・製品

エックスエーアイ、グロック向け映像生成モデル発表 コード生成モデルも強化

xAI は6月3日(現地時間)、画像から映像を生成する新モデル「グロック・イマジン・ビデオ 1.5 プレビュー (grok-imagine-video-1.5-preview)」を同社のエーピーアイ (xAI API) を通じてプレビュー提供を開始したと発表した。このモデルは静止画像をシネマティックな映像に変換し、自然言語による複雑な動きの制御を可能にする。最大720pの解像度で、元の画像の見た目や照明を保持し、細部まで再現された映像生成が特徴。同社はこれに先立ち、5月28日(現地時間)には高速なコーディングモデル「グロック・ビルド 0.1 (Grok Build 0.1)」のパブリックベータ提供も開始しており、グロック (Grok) の能力拡張を加速させている。

ベンダー・製品

OpenAI、リアルタイム音声モデルをAPIで公開 3種の新モデルで音声AI進化 5月7日(現地時間)

OpenAIは2026年5月7日(現地時間)、開発者向けAPIを通じて3種類の新たなリアルタイム音声モデルの提供を開始すると発表した。これらのモデルは、利用者の発話を推論し、リアルタイムでの翻訳や書き起こし、さらに複雑な会話の継続を可能にすることで、音声AIの能力を大幅に拡張する。新モデルのラインナップは、高度な推論能力を持つ「GPT-Realtime-2」、ライブ翻訳に対応する「GPT-Realtime-Translate」、そしてストリーミング音声テキスト変換を行う「GPT-Realtime-Whisper」で構成される。

ベンダー・製品

OpenAI、小型GPT-5.4 mini/nano発表、無料版搭載

OpenAIは2026年3月17日(現地時間)、二つの新しい小型モデル「GPT-5.4 mini」と「GPT-5.4 nano」を発表した。同社はこれらを、これまでに開発した小型モデルの中で最も高性能なものとして位置づけている。GPT-5.4 miniは、ChatGPTの無料版およびGoユーザー向けに「Thinking」機能を通じて提供される。また、他のユーザーに対しては、より大型のGPT-5.4 Thinkingモデルの利用上限を超過した際のフォールバック(代替)モデルとしても利用可能となる見込みだ。GPT-5.4 nanoは、速度とコストを最優先するタスクに特化して設計されている。

ベンダー・製品

VercelのChat SDK、メッセージサブジェクトとSDK直接アクセス機能を追加

Vercelは2026年5月19日(現地時間)、開発者向けのChat SDKに新機能を追加したと発表した。これにより、ボットがLinearやGitHubのコメントでメンションされた際に、メッセージサブジェクトを通じて親となるIssueまたはプルリクエストの情報を読み取ることが可能になる。また、GitHub、Linear、Slackのアダプターが基盤となるプラットフォームSDKを公開し、プロバイダーAPIへの直接アクセスを通じたボットの拡張を支援する。

ベンダー・製品

【速報】Anthropic、Claude Opus 4.7にFast modeサポートを追加

docs.anthropic.comが2026年5月19日(現地時間)付けで報じたところによると、Anthropic (アンソロピック) は5月12日(現地時間)にClaude Opus 4.7向けFast modeのサポートを追加した。この機能はresearch previewとして提供され、モデル「claude-opus-4-7」で速度設定「fast」を指定し、特定のベータヘッダーを使用することで、出力トークン生成速度を大幅に向上させる。