#Chain-of-thought 関連記事

LLM思考連鎖の前提依存性を検証する新手法を発表

arXivは7月10日(現地時間)、大規模言語モデル (LLM) の思考連鎖推論 (CoT reasoning) がその前提に真に依存しているかを評価するための、画期的な新しいブラックボックス手法「介入的基礎監査 (Interventional Grounding Audits)」に関する論文を公開した。ヒロナオ・ナカムラ氏らが提案するこの手法は、述語置換 (predicate substitution) を用いて、各推論ステップにおける前提への依存性を段階的にテストし、CoTの論理的整合性を厳密に検証することを目的としている。

リサーチ・論文 7月4日 06:17

Apple、RLファインチューニングVLMの堅牢性とCoT一貫性に関する研究論文を発表

Appleは2026年7月(現地時間)、強化学習 (RL) ファインチューニングを用いたビジョン言語モデル (VLMs) の堅牢性とChain-of-Thought (CoT) の一貫性に関する研究論文を発表した。同研究は、RLファインチューニングが推論集約型タスクにおける大規模言語モデル (LLMs) の強化に重要である一方、視覚的根拠の弱さやテキスト情報への過度な依存といった脆弱性が残ることを示唆している。特に、誤解を招くキャプションや不正確なChain-of-Thoughtトレースが、堅牢性と信頼性を著しく低下させると指摘した。

リサーチ・論文 5月26日 11:19

小型言語モデルCoT算術、数コピーの「読み出しショートカット」判明

arXiv cs.LGは2026年5月20日(現地時間)、Ming Liu氏が発表した論文「The Readout Shortcut: Positional Number Copying Dominates Arithmetic CoT Readout in Small Language Models」の内容を報じた。この論文は、小型言語モデルが思考連鎖 (CoT) プロンプティングを用いた算術演算を行う際、「読み出しショートカット」と呼ばれる特異な現象が性能に影響を与えることを指摘している。モデルが中間推論内容にかかわらず、回答区切り記号の前の末尾にある数値を最終的な答えとしてコピーする傾向が明らかになった。

リサーチ・論文 5月11日 16:25

推論モデルにおける位置バイアス、思考軌跡長との比例関係を明らかに

arXiv cs.AIは2026年4月20日(現地時間)、論文を公開し、Chain-of-thought (CoT) 推論（思考連鎖推論）を用いるモデルにおいて、推論軌跡の長さに比例して、質問ごとの位置バイアスが増大する可能性を指摘した。DeepSeek-R1（671B）など複数のモデル設定を用いた大規模な研究を通じて、この現象が明確に示されている。CoT推論はこれまでヒューリスティックなバイアスを低減すると一般的に仮定されてきたが、本研究結果はこれに反する新たな知見を提供するものとなる。