多くの古代文献はその成立に謎を抱えています。いつ、どこで、誰によってどのように書かれたものかが記されていない「年代不詳、作者不詳」の文献は数多く存在しますが、成立背景のよりよい理解が文献内容の理解を深めるであろうことは言うまでもありません。本研究の対象である、紀元前1500年頃から500年頃までの間に成立したと言われる、古代インドのヴェーダ祭式文献も、そのような例の一つです。
ヴェーダ祭式文献とは、紀元前1500年頃からインドに侵入したインド・アーリア人の信仰を巡って、当時の宗教者、いわゆるバラモンたちが作成した数々の聖典の総称です。彼らの宗教は、自然神を中心とした多くの神々に、讃歌と火にくべる供物を通じて交流し、自然と社会のつつがなき運行を願うもので、インド社会を現在に至るまで特徴づける宗教、ヒンドゥー教の元ともなっています。ヴェーダ文献は、いくつかの家系(あるいは学派)が、それぞれに独自のものを編纂し口伝えによって伝承してきました(文字による筆記が普及してからは、書写による伝承も加わりましたが、あくまでも口頭による伝承が伝統の中心です)。それぞれの家系が伝えるヴェーダ文献は、最も古い時代に作られた神々への讃歌や祭式の際に唱える祝詞、その後に加えられた祭式の解説、そこにさらに哲学議論、式次第の詳細、などが加えられ、長い編纂期間の中で順次充実されていった一連の文献ジャンルをセットにしたものです。つまり、様々な家系(学派)が横の関係を持つ中で、それぞれの家系が時代の推移と共に編纂された、つまり時間という縦軸に位置付けられる複数の文献を持っている。この、時間という縦軸と、古代の北インドに位置していたいくつもの家系の地理上の変化と互いの関係性の変化という横軸の中に、ヴェーダ文献の成立と発展を位置づけることができます。
当時の古代インド社会は、部族単位での遊牧移住社会から、小規模な都市国家の成立へと推移していたと考えられています。ヴェーダ文献の時間、空間的な位置づけによって、古代インド社会の発展を読み解くことが本プロジェクトの目的です。
データサイエンス×古代インド文献
ヴェーダ文献の中に見られる思想や祭式、あるいは言語現象を取り上げ、その学派間の違いや時代による変遷を考察する研究は、インド学(ヴェーダ文献学)の分野において積み重ねられてきました。このような研究にデータサイエンスの手法を取り入れることで、考察対象の規模を大きくし、より詳細な分析、より複雑な変化や関係性の考察をすることが可能になります。ヴェーダ文献の成り立ちに基づく複雑な構成や付随する地理的時間的特徴より、情報科学の様々な観点の分析により、様々な種類の分析結果が得られると考えられます。ヴェーダ文献群の中の一つ一つの文献も、一度に全体が完成されたものではなく、コア部分に順次追加部分が加えられていくという、複数の言語層を含む構成が考えられるため、まず、一つの文献の中の言語層を分析する必要があり、その上でさらに複数の文献間でその言語層ごとの比較をすることができます。文献間の比較についても、同時代と考えられるものの比較と、時代層の異なる文献の影響関係の考察が考えられます。このような様々な特徴をデータに紐づけながら相互に連携して可視化する、「ビジュアル分析」システムを作成することで、個々のデータを並べただけでは把握できない、古代インド文献の示す時空間的特徴の全体像を得ることができます。ビジュアル分析とはインタラクティブな情報可視化システムによって可能になる解析的推論を促進するアプローチのことを指します。このようにして作り上げる「文献の時空間のマッピング」は、一つの研究結果であると同時に、古代インド社会の発展をより深く議論するための出発点になり得ると考えています。
研究方法と研究チーム
研究は主に、自然言語処理の手法を用いた分析、データの可視化に重点を置いたヴィジュアルシステム開発を、二本の柱としています。これを支えているのが、ヴェーダ文献の形態素解析データの作成作業です。また、これらの研究の成果をもとに、Oliver Hellwigによる年代推定プログラムの開発に協力しています。
自然言語処理の手法を用いた分析は、この分野の目覚ましい発展と共に、常に新しい手法を取り入れつつ行っています。本パートは、若手研究者である宮川創、京極祐希、塚越柚季が担当しています。Word2Vec, Doc2Vec, Transformers, Stylometry, Text Reuse Detection等のツールを用いて、ヴェーダ文献の言語を主に語彙から分析します。文献内の章を区切って類似度分析を行うにより、文献の内部構造を考察し、さらに複数の文献を横断して分析を行うことにより、文献間の関係性を明らかにします。
データ可視化に重点を置いたヴィジュアルシステム開発には、夏川浩明と天野恭子が取り組んでいます。文献間の関係を可視化するシステムとして、祭式に用いるマントラ(祝詞)がどの文献に記載されているかを網羅した既存のインデックス*を用いた可視化ツールを開発しました。このツールはウェブ上で使用することができ、こちらで公開しています:http://ancient-india.natsukawa-lab.jp/
* Bloomfield, Maurice (1893): A Vedic Concordance. [Harvard Oriental Series 10]. Cambridge – Mass. 本研究にはこれに対する増補版(電子データ付き)を用いた:Franceschini, Marco (2007): An updated Vedic concordance : Maurice Bloomfield’s A Vedic concordance enhanced with new material taken from seven Vedic texts. Cambridge: Dept. of Sanskrit and Indian Studies, Harvard University.
このシステムでは、ヴェーダ文献を学派と時代に分類した表から、2つの文献を選び、その関係性を表示させることができます。左のChapterボックスに入力して、特定の章だけを表示させることもできます。文献の関係性は、scatter plotとparallel plotの2種類のグラフによって表され、文献のどの部分がもう一方の文献のどの部分と関係が深いか、などを考察できます。グラフはpngでデータとして出力することができます。
また、ページ左側には、文献が記述する祭式の一覧表が表示されています。ヴェーダ祭式の種類ごとに、文献の関係性を知りたい場合に、ある特定の祭式だけを選択して表示することができます。祭式名の後ろに書かれている数字は、選んだ2つの文献に共起するマントラのうちその章に含まれるマントラの数で、祭式名に重ねて棒グラフでも表示しています。共起するマントラの総数はALLの後ろに表示しています。
このマントラ共起による統計分析からは、これ以外のデータ可視化の方法も考案中です。文献間の関係性だけでなく、それぞれの文献の内部構造も可視化し、より深い考察を可能にするヴィジュアルのあり方を模索しています。
データ可視化パートのもう一つの挑戦は、研究者が実際に文献を読む際に得る感触に寄り添う可視化システムの開発です。一つの文献を地図に見立て、どこに何があるかを書き込んでいく。そのように、研究者が文献の内容や成り立ちを考える時に描く頭の中のイメージにできるだけ近い形で、可視化をするシステムを考案しています。文献や作品の内容のイメージをヴィジュアルにできるシステムが開発できれば、言語や文献ジャンルを問わず、文献や作品を深く読み込んだり、他の人との議論やイメージの共有をする際に広く役立てることができるのではと考えています。
これらの分析やツール開発を支えるのが、Oliver Hellwigの開発した文法解析情報のタグ付けシステムを用いて伏見誠、天野恭子が作成するヴェーダ文献の形態素解析付きデータです。このデータ作成は、科研費挑戦的研究(萌芽)課題番号:20K20697 『古代インド文献成立過程解明に向けた文体計量分析のためのデータベース構築』2020-2022において始動し、本プロジェクトに引き継がれました。正確な形態素解析をデータ化するためには、すべてを自動で行うことは困難であり、ヴェーダ文献の専門研究者がチェックを行うために、時間がかかっています。本プロジェクトの期間内に、研究の中心ターゲットであるMaitrāyaṇī Saṁhitā, Kāṭhaka-Saṁhitā, Taittirīya-Saṁhitāのデータを完成させる予定です。作成されたデータはDCS – Digital Corpus of Sanskrit (http://www.sanskrit-linguistics.org/dcs/index.php)に蓄積されます。
以上のデータベース作成および文献の成立や相関関係の考察によって、Oliver Hellwigの率いるプロジェクト、”ChronBMM — Bayesian Mixture Models für die Datierung von Textkorpora” (テキストコーパスの年代推定のためのベイズ混合モデル)に協力しています。ChronBMMが目指す、ヴェーダ文献を含む古代文献の年代推定プログラムの開発のために、本プロジェクトから、推定結果への評価とモデル改良のための提言を行います。
ChronBMMのサイトおよびドイツ研究教育省Digital Humanitiesプロジェクトのサイトはこちら:
https://chronbmm.phil.hhu.de/
https://www.geistes-und-sozialwissenschaften-bmbf.de/de/Digital-Humanities-1710.html