リサーチ・論文

arXiv、類推推論強化の言語モデル学習手法を提案

科学論文リポジトリのarXivは6月11日(現地時間)、Zilin Xiao氏らの研究チームが、言語モデルに類推による推論能力を付与する新しい学習フレームワーク「Retrieval-Augmented Reinforcement Fine-Tuning (RA-RFT)」を提案したと発表した。この手法は、従来のRetrieval-augmented generation (RAG) が持つ課題を克服し、文脈の類似性ではなく推論への寄与度に基づいて情報を選択することで、複雑な推論タスクにおける言語モデルの性能向上を目指す。

リサーチ・論文

スロバキア語向けテキスト埋め込み「SkMTEB」発表、低リソース言語のモデル開発を促進

arXiv cs.CLは2026年6月11日(現地時間)、Marek Šuppa氏らが執筆した論文を公開し、その中で低リソース言語であるスロバキア語を対象とした初の包括的なテキスト埋め込みベンチマーク「SkMTEB」を発表した。このベンチマークは、31のデータセットと7種類のタスクタイプで構成されており、既存の多言語ベンチマークに比べスロバキア語の網羅範囲が約4倍深く、精緻な評価を可能にする。論文では、31の埋め込みモデルを評価した結果、大規模な命令チューニング済み多言語モデルが最も高い性能を示し、既存のスロバキア語特化NLUモデルは埋め込みタスクへの転移性能が低いことが判明したと報告している。

リサーチ・論文

【速報】Google、Agentic RAG導入で企業向けAI応答精度向上

Google ResearchとGoogle Cloudは2026年6月5日(現地時間)、複雑なエンタープライズクエリに対し、信頼性の高い応答を生成するAgentic RAG(Retrieval-Augmented Generation)フレームワークを「Gemini Enterprise Agent Platform」に導入したと発表した。この新システムは、従来のRAGの課題を克服し、複数ソースからの情報検索と反復的なコンテキスト収集を通じて、事実性データセットにおける精度を最大34%向上させたと報告されている。

リサーチ・論文

ContextRAGを発表、LLM不要なグラフ構築でRAGの効率化とコストを大幅削減

Roman Prosvirnin氏、Sergei Kuznetsov氏、Seungmin Jin氏らは2026年5月19日(現地時間)、学術論文リポジトリarXivに掲載された論文で、Retrieval-Augmented Generation(RAG)システム「ContextRAG」を発表した。このシステムは、大規模言語モデル(LLM)を用いてエンティティや関係を抽出するプロセスを不要とし、グラフ構造を直接構築することで、インデックス作成時に発生するトークンコストおよび実時間コストの大幅な削減を実現する。

ベンダー・製品

PaddleOCR 3.5、Transformersを推論バックエンドに採用

Hugging Face Blogが2026年5月18日(現地時間)付けで報じたところによると、PaddleOCR 3.5がリリースされ、Hugging Face Transformersを推論バックエンドとして利用可能になった。これにより、サポートされるPaddleOCRモデルは`engine="transformers"`を設定することでTransformersと連携して動作する。この変更は、OCRおよび文書解析タスクをHugging Faceエコシステムに統合する。

ベンダー・製品

OncoAgent、プライバシー保護を重視した腫瘍学臨床意思決定支援システムを発表

OncoAgent Research Groupは2026年5月9日(現地時間)、オープンソースのプライバシー保護型腫瘍学臨床意思決定支援システム「OncoAgent」を発表しました。このシステムは、デュアルティアのLLMアーキテクチャと、マルチエージェントのLangGraphトポロジー、4段階のCorrective RAGパイプラインを組み合わせています。70以上の医師向けNCCNおよびESMOガイドラインに基づき、3層のリフレクション安全バリデーターが厳格なZero-PHIポリシーを適用します。