こにしき(言葉・日本社会・教育)

関西学院大学(2016.04~)の寺沢拓敬のブログです(専門:言語社会学)。

統計解析を学ぶことの「教養」的意義

Ask.fm というサイトで、以下のような質問を頂きました。

統計学の知識はとりあえず必要なさそうな人生ですが、統計を学ぶことに、何か教養的意義のようななものはありますか。


僕は統計学を専門的に学んでいませんが、統計統計の教養的意義については日頃から多少思っているところがあるので、この機会に書いてみます。

意義その1 ほぼ全ての社会現象に例外が存在することが理解できる

たとえば、「科学的な研究により、女性のほうが男性よりもXXXの傾向があることがわかった」というレトリックを見ると、「多くの女性は多くの男性よりもXXXだ」と感じてしまう人は多いかもしれません。人によっては、「ほとんどの女性はほとんどの男性よりもXXXだ」と解釈する人さえいそうです。


実際にデータをいじってみれば、日夜「発見」される男女差のなかに、ここまで劇的な差が出るものは稀だということがわかるはずです。逆に劇的な差がでるものは、分析をするまでもなく自明なものがほとんどです ---たとえば「女性のほうが男性より出産経験が多い傾向があることがわかった」のように。


統計解析において、差の大きさや関連の強さを示す指標は多数あります。最も有名なのが相関係数でしょうか。こうした指標の数学的定義を学べば、そもそもどんな指標であっても例外の存在を前提にしていることがわかるはずです。


また、実際にデータをいじってみれば、「差がある」「関係がある」と言われる社会現象のほとんどが、多数の例外を抱え込んでいるということがわかるはずです。


そういう意味で、統計解析には、「例外の存在」にもきちんと想像が働かせられるようになるという教養的意義があると思います。もちろん、統計など学ぶまえに、こうした想像力をすでに獲得している人には、あまり意義はありませんが。



意義2 目に見えるものが全てではないと実感でき、安易な本質主義に陥らないようになる


目に見えるもの(「観測可能なもの」という言い方をします)は、ほんとうに知ろうとしているものの仮の姿でしかありません。


優先席でお年寄りに席をゆずらない若者がいた(=観測可能)としても、その人が思いやりがないかどうか(=ほんとうに知りたいこと)は、究極的にはわかりません。もしかしたら、その若者は足に重い(しかし一見わからない)障害を抱えているかもしれません。


また、気になる人からのメールにいつもハートマークがある(=観測可能)からといって、その人が自分に好意を寄せているかどうか(=ほんとうに知りたいこと)は、わかりません。その人は、みんなに「平等に」ハートマークを送っているかもしれないのです。

統計解析では、ほとんどの場合、目に見えるものと目に見えないものの区別を前提にします。たとえば、


ある能力 = テストAの成績 + 誤差


ここで、重要なのが「誤差」です。上記の等式が妥当だったとしても、誤差がある以上、例外はいくらでも存在します。したがって、テストAの成績(観測可能なもの)だけで、ある特定の人の能力を判断してしまうのは実は危険なことです


なお、ひょっとすると、統計家に対してまさに上のようなイメージがあるかもしれません。つまり、「数値だけで人を判断するような人」というイメージです。しかし、実際には、そういう統計家は稀だと思います。誤差が存在することを知っているからです。


というわけで、「目に見えるものだけで人や物事を安易に判断しない」、こういう態度が統計解析を学ぶことで身につくかと思います。

例外や多様性を切り捨てるのはレトリック

最後に余談ですが、統計解析の初学者が、「統計は、例外的な人や社会の多様性を無視している」みたいなことを言っているのをしばしば目にします。


以上の議論から明らかなとおり、例外・多様性の切り捨ては、統計解析そのものの特徴ではありません。おそらく、上記の発言の真意は、「平均値」などの個別のツールに関する指摘でしょう ---たしかに、「平均値」が例外を切り捨てるのは事実です。


私は、むしろレトリックのほうが例外・多様性を無視してしまうのではないか、と思っています。冒頭の例ですが、「女性のほうが男性よりもXXXである」というレトリックを使った時、XXXではない女性の存在はこのレトリックからはうかがい知れません。しかし、「女性の90%がXXXであるが、男性の場合、XXXなのは10%だけだった」ならば、「XXXでない10%の女性」や「XXXな10%の男性」に想像をめぐらせることができるはずです。