AI Edgeline
最新まとめ【速報】公式VCベンダー論文音声規制About
キーワードを入力
    最新まとめ【速報】公式VCベンダー論文音声規制About
    キーワードを入力
      最新
      ベンダー・製品 【速報】Databricks、「Data + AI Summit 2026」を開幕 — 主要幹部らが登壇 VC・資金調達 SaaS事業モデル変革期、AIとLLMが成功法則を再構築 VC・資金調達 クランチベース・ニュース指摘、AIスタートアップ資金調達の88%が米国に集中し世界的分布に不均衡 VC・資金調達 アンソロピック、安全性巡り米政府と対立 ベンダー・製品 【速報】Auth0がVercel Marketplaceに参画 リサーチ・論文 LLM開発で「文化データ漏斗」課題、学習偏りが多様性阻害と指摘 リサーチ・論文 ニューラルネットワークのグロッキング遅延、重みノルムが時間尺度を決定 リサーチ・論文 arXiv、WorkBenchベンチマークで職場エージェントの性能と安全性向上の最新分析を公開 ベンダー・製品 【速報】Vercel、Hobbyユーザー向けBlobストア制限を緩和 ベンダー・製品 Waymo、月額29.99ドルのロボタクシーサブスクリプション「Premier」提供開始 ベンダー・製品 Zhipu、「GLM 5.2」公開 100万トークン対応 リサーチ・論文 PyPI、Pyodide向けWASMホイールを直接公開 ベンダー・製品 Waymo、Appleの自動運転車試験場を2億2000万ドルで買収 リサーチ・論文 Simon Willison氏、SQLiteクエリ結果カラムのソース特定手法を公開 リサーチ・論文 米国商務省、Anthropic製AIモデルに輸出管理規制
      1 / 15

      Tag

      #WorkBench

      1 件の関連記事

      リサーチ・論文 · 6月15日 23:15 注目

      arXiv、WorkBenchベンチマークで職場エージェントの性能と安全性向上の最新分析を公開

      arXiv (アーカーイブ) は2026年6月10日(現地時間)、「WorkBench Revisited: Workplace Agents Two Years On」と題する論文を公開し、職場向けエージェントの性能が過去2年間で大幅に向上したことを明らかにした。この分析によると、2024年3月時点の最良エージェントであったGPT-4はタスク完了率43%、意図しない有害な行動率26%を記録していたが、2026年6月時点の最良エージェントであるClaude Opus 4.8はタスク完了率89%、意図しない有害な行動率2.5%を達成した。

      arXiv cs.AI 続きを読む →
      AI Edgeline

      シリコンバレーの超最前線の AI 情報を、毎日最速でアップデート。一次情報を、新聞記事スタイルで届けます。

      カテゴリ

      • 【速報】公式 24h 以内
      • メーカー公式発表
      • VC・資金調達
      • ベンダー・製品
      • リサーチ・論文
      • ポッドキャスト
      • 規制・政策

      編集について

      • 編集方針
      • RSS フィード
      • X (旧 Twitter)
      • GitHub

      すべての記事に原文へのリンクと公開日時を併記しています。一次情報の信頼性を最優先に運営しています。

      © 2026 AI Edgeline