ディープレインフォース (DeepReinforce) は2026年6月29日(現地時間)、エージェントコーディングに特化したオープンウェイトの大規模言語モデル (LLM) である「Ornith-1.0」をリリースした。これは同社にとって初のモデルリリースとなる。Ornith-1.0は既存のGemma 4とQwen 3.5を基盤として構築されており、同規模のオープンソースモデルと比較して、コーディングベンチマークにおいて最先端の性能を示すとしている。

Ornith-1.0には、9B Dense、31B Dense、35B MoE、397B MoEを含む複数のバリアントが存在する。このモデルはMITライセンスで提供され、基盤となっているGemma 4およびQwen 3.5もそれぞれApache 2.0ライセンスであり、互換性がある。

Simon Willison’s Weblogのサイモン・ウィリソン (Simon Willison) 氏の報告によると、同氏はLM Studioと20GBのornith-1.0-35b-Q4_K_M.ggufをPiに接続してOrnith-1.0を実行した。ウィリソン氏の初期評価では、同モデルが多数のツール呼び出しを伴うエージェントハーネスを熟練した方法で実行できると述べている。具体的なタスクとしては、Datasetteのコードベースに対しfind the code that decodes the actor cookieやfind the code that opens the insert dialog when thebutton is clickedといったクエリを容易に処理したという。また、ペリカンの画像生成も103トークン/秒で実行し、画像は不明瞭ながらもペリカンとして認識可能だった。

DeepReinforceに関する詳細な情報は不足しているが、同社から確認できる最も古い論文は、2025年6月のCUDA-L1: Improving CUDA Optimization via Contrastive Reinforcement Learningである。


参考: Simon Willison’s Weblog (アーカイブ) — 2026年6月30日 01:17 (JST)

原文ハイライト

"Self-Scaffolding LLMs for Agentic Coding"

この記事をシェア
X はてブ LinkedIn