リサーチ・論文

ジョイ・ボーズ氏、インド哲学比較コーパス「Darshana Graph」公開

ジョイ・ボーズ (Joy Bose) は6月16日(現地時間)、古典インド哲学の比較分析に特化した大規模な並列注釈コーパス「ダルシャナ・グラフ (Darshana Graph)」を発表した。同コーパスは、ヒンドゥー教、仏教、ジャイナ教の伝統に属する12万5,000件以上のテキスト記録で構成される。特に、8,500件のヒンドゥー教およびジャイナ教の記録は、18人の歴史的注釈者が同一の根本経典やスートラをどのように解釈したかを比較できるよう構造化されている。

リサーチ・論文

DeepMind、高速テキスト生成モデル「DiffusionGemma」を発表

DeepMindは2026年6月9日(現地時間)、テキスト拡散技術を応用した実験的オープンモデル「DiffusionGemma」を発表した。このモデルはApache 2.0ライセンスで提供され、従来の自動回帰型大規模言語モデル(LLM)の逐次処理と異なり、テキストブロック全体を同時に生成する。これにより、GPU環境下で最大4倍の高速なテキスト生成を実現し、速度が重視されるインタラクティブなローカルワークフローへの活用が期待される。

リサーチ・論文

大規模言語モデルの誤答抑制へ、「未知の未知」診断SICsで精度向上

米学術機関リポジトリarXiv cs.CLは2026年6月7日(現地時間)、大規模言語モデル(LLM)が自身の知識の範囲外にある質問に対し、知らないことを認めずに誤った回答を生成する課題に対処する研究論文を公開した。Subramanyam Sahoo氏が導入した「Structured Ignorance Certificates (SICs、構造化無知証明書)」は、モデルに不足する知識領域を特定させ、関連概念を列挙し、直接回答ではなく有効な検索クエリを提案させるJSON形式の出力スキーマである。735の「Unknown-Unknown (UU、未知の未知)」質問による評価では、99.46%のJSON有効性率と0.967の平均Certificate Specificity Scoreを達成。ベースモデル比でROUGE-Lが3.6%改善された。

リサーチ・論文

大規模言語モデル駆動エージェント社会の長期シミュレーション「Agentopia」発表

Xintao Wang氏らは6月5日(現地時間)、大規模言語モデル(LLM)が駆動するエージェントによる長期的な社会生活シミュレーション「Agentopia」に関する研究論文を学術論文公開サイトarXiv cs.CLで発表した。本研究は、従来のAIエージェント社会シミュレーションが抱える期間や相互作用の制約を克服し、LLM搭載エージェントによる現実的で複雑な社会的行動の創発と、人間の社会生活における学習プロセスの再現を目指している。

リサーチ・論文

LLMの構造化推論を視覚グラフで支援、整理能力向上に新たな知見

arXiv cs.AIは2026年6月2日(現地時間)、「Visual Graph Scaffolds for Structural Reasoning in Large Language Models」と題する論文を発表した。この研究は、大規模言語モデル (LLM) が複雑な構造化推論を行う際、グラフが単なる外部知識源としてだけでなく、推論プロセスを整理する内部的な足場 (スキャフォールド) としても機能する可能性を示唆している。人間がマインドマップを用いて思考を整理する仕組みから着想を得ており、LLMの推論能力向上に新たな視点を提供する。

リサーチ・論文

大規模言語モデル、環境態度で人間上回る傾向―プロンプト操縦性に課題

arXiv cs.CLは2026年6月1日(現地時間)、大規模言語モデル (LLM) の環境に対する態度に関する研究論文が発表されたと伝えた。持続可能性関連の意思決定支援や情報発信にLLMの利用が広がる中、その出力が持つ環境態度に関する体系的な証拠の不足に対応するもの。31の商用およびオープンウェイトモデルを対象とした評価の結果、多くのLLMが平均的な人間よりも環境的に進歩的な態度を示す傾向が明らかになった。しかし、プロンプトによる操縦可能性という課題も浮き彫りとなった。

リサーチ・論文

LLM回答格差の主因は会話トピック、高リスク分野で影響課題に

arXiv cs.CLは6月3日(現地時間)、論文を報じ、大規模言語モデル (LLM) が法務、医療、金融といった高重要度分野で利用される際、わずか1回の会話履歴でもユーザー間で異なる結果が生じうると指摘した。従来の分析では社会人口統計学的グループ間の格差と捉えられ、特定のグループが有利な結果を得ると示唆された。しかし本研究は、LLMが単一会話履歴からユーザーの社会人口統計学を推論するのは困難で、格差規模は最小限であると結論付けた。

リサーチ・論文

大規模言語モデル、データ時間性考慮で知識獲得 最新情報反映、ピルシェン氏らの研究

ピルシェン・イポリット氏 (Pilchen Hippolyte) を含む研究チームは2026年5月21日(現地時間)、大規模言語モデル (LLMs) の事前学習におけるデータ時間性 (temporality) の影響に関する研究論文をarXiv cs.CL上で公開した。この研究は、LLMsが通常、時間情報がシャッフルされたコーパスで学習され、その知識が学習時に固定されることで、時間的な知識の関連付けが十分に理解されていない現状に一石を投じる。彼らの調査は、LLMsの知識鮮度と正確性を高める新たな道を示唆している。

リサーチ・論文

arXiv、LLM性能へのデータ影響解明へ「データプローブ」手法を提唱

arXiv cs.AIは2026年5月11日(現地時間)、大規模言語モデル (LLM) の性能におけるデータの役割を根本的に理解するため、新しい手法「データプローブ」の開発を提唱するポジションペーパーを発表した。この手法は、適切に定義されたランダムプロセスから合成シーケンスを生成し、LLMの振る舞いを体系的に観察することで、データ特性がモデル性能、汎化、堅牢性 (robustness) に与える影響を解明することを目指す。

リサーチ・論文

LLM量子化で公平性劣化、新たなバイアス誘発の危険性浮上

Plawan Kumar Rath氏らは2026年5月2日(現地時間)、大規模言語モデル(LLM)の圧縮に用いられる量子化技術が、モデルの公平性を損ない、新たなバイアスを誘発する危険性があるとの研究論文をarXiv cs.LGで公開しました。この研究は、Qwen2.5-7B、Mistral-7B、Phi-3.5-miniの3モデルを対象に、BF16から3ビットまでの5段階の精度レベルで検証を実施。特に3ビット量子化では、これまでバイアスが確認されなかった項目で6~21%のステレオタイプな振る舞いが生じることが判明しました。

リサーチ・論文

大規模言語モデル、事前学習と同一オプティマイザで忘却を抑制

arXiv cs.LGが2026年5月7日(現地時間)付けで報じたところによると、大規模言語モデル (LLMs) の学習において、事前学習 (pretraining) と同じオプティマイザ (optimizer) を用いたフルファインチューニング (full finetuning) が、より良好な学習と忘却のトレードオフ (learning-forgetting tradeoff) を達成することが明らかになった。これは、新しいタスクにおける同等またはそれ以上の性能を維持しつつ、忘却を低減させる効果があるという。研究者らはこの現象を「オプティマイザとモデルの一貫性 (optimizer-model consistency)」と命名した。

リサーチ・論文

LLM向け戦略的軌道抽象化フレームワーク「StraTA」登場

arXivは2026年5月7日(現地時間)、Xiangyuan Xue氏らの研究チームが、大規模言語モデル(LLM)をインタラクティブエージェントとして最適化する新フレームワーク「Strategic Trajectory Abstraction (StraTA)」を発表したと報じた。StraTAは、エージェント型強化学習に軌道レベルの戦略を導入することで、既存手法が抱える長期的意思決定における探索とクレジット割り当ての課題解決を目指す。ALFWorld、WebShop、SciWorldでの実験では、サンプル効率と最終性能の向上を示した。