ジョイ・ボーズ (Joy Bose) は6月16日(現地時間)、古典インド哲学の比較分析に特化した大規模な並列注釈コーパス「ダルシャナ・グラフ (Darshana Graph)」を発表した。同コーパスは、ヒンドゥー教、仏教、ジャイナ教の伝統に属する12万5,000件以上のテキスト記録で構成される。特に、8,500件のヒンドゥー教およびジャイナ教の記録は、18人の歴史的注釈者が同一の根本経典やスートラをどのように解釈したかを比較できるよう構造化されている。

ダルシャナ・グラフは、バガヴァッド・ギーター (Bhagavad Gita)、ブラフマ・スートラ (Brahma Sutras)、主要ウパニシャッド (Upanishads)、パーリ律 (Pali Canon)、主要ジャイナ教典といった公開ドメインおよびオープンライセンス翻訳から資料を収集している。このコーパスの独特な貢献は、同一の根本経典やスートラが、ヴェーダーンタ (Vedanta) の五つの学派を含む18人の歴史的注釈者間で整合されている点にある。これにより、独立した解釈伝統が同一の資料をどのように読んだかを直接比較することが可能となる。このような大規模な交差注釈者の整合を提供する公的リソースは他にはないとされる。

このコーパスに基づき二つの分析が提示された。一つ目は、機械学習を必要としないスタイル計量学的比較で、聖典引用密度、明示的な反論率、文の複雑さを通じて論証スタイルを測定した。この分析により、引用密度と反論率の間に中程度の負の相関があること、関連する教義的系統の三人の注釈者間で反論率が著しく増加すること、そしてパーリ律内でのジャンルレベルの測定可能な違いが発見された。

二つ目の分析では、制約付き大規模言語モデル (LLM) パイプラインが記述された。これは、事前定義された関係語彙と確定的な事後検証を用いて、概念間の類型化された哲学的関係を抽出するものである。生成されたグラフは、学派間の意見不一致パターンを明らかにする一方で、独立した埋め込みベースの分析とグラフ由来の発見が一致しないケースなど、抽出の重要な限界も示した。

Joy Boseは、完全なコーパス、抽出された関係グラフ、およびすべてのソースコードを公開している。


参考: arXiv cs.CL (アーカイブ) — 2026年6月17日 02:49 (JST)

この記事をシェア
X はてブ LinkedIn