#ArtificialIntelligence 関連記事

Appearance Pointers: Diffusion Transformersでマルチモーダル領域制御の新手法

arXiv cs.CV は7月21日(現地時間)、ジェネレーティブ画像生成における領域制御に新たな手法を導入する論文を公開した。この論文によると、Diffusion Transformers (DiTs) に「appearance pointers」と呼ばれる機能を導入することで、テキストプロンプトのみでは困難だったマテリアルやオブジェクトの識別、空間配置といった要素の正確な領域制御が可能になる。これにより、クリエイティブ分野の専門家が求める高精度な領域制御の課題解決を目指す。

VC・資金調達 6月24日 23:21 注目

ペレグリン・テクノロジーズ、シリーズDで2.5億ドル調達

ペレグリン・テクノロジーズ (Peregrine Technologies) は2026年6月23日(現地時間)、政府および複雑な組織向けの運用ソフトウェア事業拡大に向けたシリーズD資金調達で2億5000万ドルを調達した。このラウンドにより同社の評価額は68億ドルに達した。既存投資家のフィフス・ダウン・キャピタル (Fifth Down Capital) が主導し、セコイア・キャピタル (Sequoia Capital)、OGベンチャー・パートナーズ (OG Venture Partners)、ゴールドクレスト・キャピタル (Goldcrest Capital) などが参加した。

リサーチ・論文 6月9日 03:15 注目

「SafeGene」、LLMの安全性劣化を防ぐ再利用可能アダプターを提案

arXiv cs.AIは2026年6月2日(現地時間)付けで提出された論文で、オープンウェイト大規模言語モデル（LLM）のファインチューニング時に頻発する安全アライメントの弱体化という課題に対し、革新的な解決策「SafeGene」を発表した。SafeGeneは、モデル固有の修復ではなく、タスク横断的に再利用可能な安全性アダプターモジュールとして機能するよう設計されており、アーキテクチャ互換性のあるモデルファミリー全体でその有効性を示している。これにより、LLMの安全性を効率的に維持しつつ、多様なカスタム利用への適応を可能にする。

リサーチ・論文 6月3日 03:15 注目

大規模言語モデル圧縮に新手法SubFit、arXivが発表

arXiv cs.CLが2026年6月1日(現地時間)付けで報じたところによると、大規模言語モデル（LLM）の学習後圧縮に関する新たな研究論文が公開された。エリア・クネガッティ (Elia Cunegatti) 氏らは、既存の圧縮手法が持つ「フルレイヤー粒度」と「連続選択」という設計上の制約は過度に制限的であると指摘。この課題を克服するため、サブモジュールレベルでの圧縮を可能にする新手法「SubFit (Submodule-level Fitted residual replacement)」を導入した。

リサーチ・論文 5月20日 19:17

文書AI運用化へマイクロサービス提案　OCRとLLM連携パイプライン最適化

arXiv cs.AIは2026年5月12日(UTC)付けで、文書AI（Document AI）システムを本番環境で運用化するためのマイクロサービスアーキテクチャに関する研究論文を発表した。同論文は、文書の分類、光学文字認識（OCR）、大規模言語モデル（LLM）を用いた構造化フィールド抽出など、複数のモデルパイプラインをカプセル化する設計を詳述している。これは、学術研究で生まれた先進技術と、実稼働環境での効率的かつ堅牢な実装との間のギャップを埋めることを主目的としている。

リサーチ・論文 5月20日 11:20

arXiv、検証可能なソフトウェア世界「OpenComputer」発表

科学論文プレプリント公開サイトarXivは2026年5月19日(現地時間)付けで、コンピュータ利用エージェント向けに検証可能なソフトウェア世界を構築するためのフレームワーク「OpenComputer」を発表した。このフレームワークは、実アプリケーションに対する構造化された検査、自己進化型検証、デスクトップタスク生成、評価ハーネスの四つの主要コンポーネントを統合する。

リサーチ・論文 5月15日 12:34

VegAS、検証器活用でエンボディドAIのロバスト性向上

VegASは2026年5月12日(現地時間)、arXiv cs.AIにて論文として公開された。汎用エンボディドエージェントのロバスト性向上を目的としたフレームワークで、MLLMベースエージェントが困難なシナリオで示す脆弱性を克服するため、明示的な検証ステップを導入する。推論時に複数の候補行動を評価し、最も信頼性の高い選択肢を選び出すことで、既存の強力な連鎖思考（CoT）ベースラインに対し最大36%の性能向上を達成。LLM駆動のデータ合成戦略で検証器を訓練する点が、従来の推論時計算手法との差別化となる。

リサーチ・論文 5月14日 04:34

拡散型言語モデル向け制御生成、適応型スケジューラーで改善

arXiv cs.LGは2026年5月8日(現地時間)、Hanhan Zhou、Shamik Roy、Rashmi Gangadharaiahの3氏による論文を発表した。同論文は、離散拡散型言語モデル（DLMs）における制御生成手法の改善を提案。既存手法が抱える生成品質の低下という課題に対し、属性のコミットタイミングに応じた適応型スケジューラーの有効性を示した。

#ArtificialIntelligence