リサーチ・論文

小型言語モデルCoT算術、数コピーの「読み出しショートカット」判明

arXiv cs.LGは2026年5月20日(現地時間)、Ming Liu氏が発表した論文「The Readout Shortcut: Positional Number Copying Dominates Arithmetic CoT Readout in Small Language Models」の内容を報じた。この論文は、小型言語モデルが思考連鎖 (CoT) プロンプティングを用いた算術演算を行う際、「読み出しショートカット」と呼ばれる特異な現象が性能に影響を与えることを指摘している。モデルが中間推論内容にかかわらず、回答区切り記号の前の末尾にある数値を最終的な答えとしてコピーする傾向が明らかになった。

リサーチ・論文

推論モデルにおける位置バイアス、思考軌跡長との比例関係を明らかに

arXiv cs.AIは2026年4月20日(現地時間)、論文を公開し、Chain-of-thought (CoT) 推論(思考連鎖推論)を用いるモデルにおいて、推論軌跡の長さに比例して、質問ごとの位置バイアスが増大する可能性を指摘した。DeepSeek-R1(671B)など複数のモデル設定を用いた大規模な研究を通じて、この現象が明確に示されている。CoT推論はこれまでヒューリスティックなバイアスを低減すると一般的に仮定されてきたが、本研究結果はこれに反する新たな知見を提供するものとなる。