2010-03-25

「文献の計量分析」について

雑誌「日本語学」(明治書院)の2010年1月号の特集「源氏物語のことば」に、「文献の計量分析」(村上征勝)という記事が載っていた。これを例に、以前から感じていたことをちょっと書きたいと思います。なぜですます調かというと、これから(また)たいへん生意気なことを書くからです。

源氏物語に限らず、古文の研究では時折こうした統計的な手法が使われる。また、そうした研究に基づく成果が、さまざまな問題に対する判断材料として参照されたりもする。「読解」にもとづく古典的な研究に対して、こうした研究は数式やグラフなど使ったりしていかにも科学的に見える。しかし統計的分析は注意して扱わないと、ともすれば恣意的な結論を導くことにもなりかねないと僕は思っている。統計は、それが意味のある統計なのかどうかをよく吟味してかかる必要がある。

「文献の計量分析」では、はじめに現代日本語文の計量分析の有効性について説明されている。そのこと自体は導入として自然な話だと思う。さて、ここで有効であるということが紹介されているのは、書き手の読点の打ち方の傾向についてである。

続いて記事は古文の計量分析の話に移り、『源氏物語』の宇治十帖他作家説について検討を試みる。しかしここで分析の対象にされているのは名詞や助動詞の出現率である。それが有効な手法であるかどうかについてはこの記事では説明されてないのにだ。こういうところで、僕はこの記事に対して大きく不満がある。それなら最初の読点の打ち方の話は何だったんだと。人を信じ込ませやすくするブラフか? もちろん古文にはもとから読点がないのは知っている。それでもじゃあなんでその話をしたのかという疑問はなお残る。あとの説明を納得できるようにしたいのであれば、現代日本語文の名詞や助動詞の出現率の評価の有効性について言及するべきではないか?

記事は名詞や助動詞の出現率が評価として有効なのかどうか不安を抱えたまま話は続き、以前ここでも紹介した源氏物語の成立分類についての話になる。ここで、A, B, C, D がそれぞれ特徴的な偏りを示したという説明がなされる。これまでの学説と一致しているというわけである。だがここでも説明に物足りなさが残る。それは、その結果に意味があるのかという点である。偏り具合から個々の巻が A 系、B 系のどこに属するのかを判定できるということを意味しているのか、というもっともな疑問に対する答は書かれていない。

たとえば、無作為に分類した4つのグループでは絶対にこうした偏りは現れないのだろうか。そういうことが書かれていないのでその結果の価値がわからない。もし無作為では現れないというのであればなるほどそれは「これまでの定説は否定できない」という結論にはなるだろう。しかしそれだけではあまり意味がないのも確かだ。

さらに、たとえば B 系は、「2. 帚木」「3. 空蝉」「4. 夕顔」「6. 末摘花」「15. 蓬生」「16. 関屋」「22. 玉鬘」「23. 初音」「24. 胡蝶」「25. 螢」「26. 常夏」「27. 篝火」「28. 野分」「29. 行幸」「30. 藤袴」「31. 真木柱」からなるが、仮に「2. 帚木」以外の15帖から偏りを算出した時に、その偏りをもとに「帚木」の巻を評価すると、はたして「帚木」はそのグループの巻であるという判定ができるのか、ということについても説明がほしい。こうしたテストは交差検定といって、これを「帚木」に限らず B 系のすべての巻について行なっていくわけである。それが有効に機能したということになれば、はっきり言って源氏物語の成立問題は解決してしまうはずだから、まあそうなっていないのだろうとは思うけど。

こうしたことの説明がないので、結局この記事は「統計的手法をもって源氏成立論の定説の正当性を補強した」ものなのか「源氏成立論の定説をもって統計的手法の正当性を補強した」ものなのかよくわからないという印象を受ける。

まだある。ここで成立論の分類に使われた巻の構成そのものについて。別人の作による可能性が高いという「匂宮」「紅梅」「竹河」の3帖を C 系に入れて集計したのはなぜなのか。さらに慎重を期すなら成立時期に議論のある「桐壺」を A 系に入れて集計したのはどうなのか。

以上のことから、これだけ科学的に書かれているように見えながら、「有効性が説明されてない」「結果の意味するところが説明されてない」「統計を行なった過程に疑問が残る」という理由から、僕にはこの記事の内容を評価することができない。これは僕が馬鹿だからなのか? それは否定しないけど。

統計的手法のそのものを否定するつもりはまったくないですよ。たとえば森博達の『日本書紀の謎を解く』『古代の音韻と日本書紀の成立』で挙げられている諸データはまさに真実を浮かび上がらせるもので、統計以外の方法では明らかにならなかった成果だと思う。僕はこれらのデータが正しいかどうかは確認できないけど、「データが正しければ、それについての考察も正しいであろう」ということは読んでいて追うことができる。そこが大事なところだと思うのだ。もちろんなにからなにまでそんなにはっきりとした成果にはならないというのは理解できる。でもせめて、こういう結果ならこう推論できるとか、その思考過程だけは明確にたどれるようにしてほしいと思う。

生意気言ってすみません。

0 件のコメント:

コメントを投稿

注: コメントを投稿できるのは、このブログのメンバーだけです。