こにしき(言葉・日本社会・教育)

関西学院大学(2016.04~)の寺沢拓敬のブログです(専門:言語社会学)。

無作為抽出の「超」重要性と、スープの比喩

※前半は社会調査法の教科書的な普通の記述です。この記事独自のネタは後半です

無作為抽出とは

ある集団全体の特性を知りたいとき、その集団が大して大きくないときには、そのメンバー全員を調べればすみますが、その集団のサイズが大きくなると、たいへん困難になります。例えば「XX中学3年Y組の生徒」や「XX中学の3年生」であれば、きちんと準備をしさえすれば全員を調査できないこともありませんが、それが「県内の中学三年生」とか「日本の中学三年生」はては「中学三年生」となると、集団のサイズが大きくなりすぎて、全員を調査するのはまず不可能です(ただし、全国学力テストは「全員」を調査したものですが、それは文部科学省という大きな力をもってして可能になりました)。


さて、こういう大集団を相手にする場合、集団の一部を取り出してきて、その一部の特徴から集団全体の特徴を推定するという方法がとられます。これは標本調査(サンプル調査)と呼ばれるものです。


しかし、ただ闇雲に標本を取り出してくればいいというものではありません。集団全体をきちんと代表した「偏りのない」標本を取り出さなくてはいけないのです。この「偏りのない」標本を得る方法を無作為抽出と言います。

スープの味見の比喩

無作為抽出の理解に役立つ比喩として「スープの味見」というものがあります。例えば次のようなものです。

[スープの入った鍋を]よくかき混ぜてからすくいあげて飲めば、少し飲んだだけでスープ全体の味がわかる。しかし、そうでなければ、固まっている塩や薬味、具などが拡散したときには味が一変してしまう。それでは、いくら味見をしても正確なところはわからない。

ネット世論調査は信用できるのか?: 歌田明弘の『地球村の事件簿』


ここで「よくかき混ぜる」が無作為化(ランダマイゼーション)にあたります。そして、そのかき混ぜられたスープからスプーンひとさじをすくいあげる作業が標本抽出にあたります。この一連の作業が無作為抽出なのです。

無作為抽出の調査は、客観的でなくなる?

一般的な社会調査論の講義は、ここまでで無作為抽出の原理は終わりにして、次に、その具体的な適用に話が移ります。「スープの比喩でみんなが原理を理解できた」という一応の前提があるからでしょう。


しかし、話が抽象的なレベルでは多くのひとが納得可能なスープの比喩も、実際の調査データと接するような場面では、必ずしもすんなりと受け入れられるわけではありません。


往々にして、巨大な集団を相手にする場合、測定上の客観性はある程度犠牲になります。例えば「日本人」全体を調べるアンケート調査の場合、日本全国至る所に居住する様々なタイプの人々を調べることになります。そこで例えば「年収」を調べたい場合、もっとも正確にやろうとすれば、調査員を各地の税務署に潜入(侵入?)させて、サンプルに選ばれたひとの年収を一人ひとり調べるという方法が考えられます。


しかしながら、それではあまりに時間やお金がかかりすぎ、、第一、倫理的に許されません。というわけで、代替案として、面接法や質問紙法(アンケートを郵送する)といった方法がとられます。ただ、これは、上述の「税務署潜入法」よりも客観性に欠けると言わざるを得ません。なぜなら、多くの一般人は、自分の年収の厳密な額を把握していないからです。たとえば、副収入や税収なども含めて、年収579万7556円だった人がそのままの数値を回答するとは考えにくいでしょう。たいていは、「600万」とか「550万」などと答えるのではないでしょうか。それに、職業によっては、自分の年収が正確に把握できない場合もあります。そして、そもそも回答者が、本当の額を答えるかどうかもわかりません。


以上の様に、無作為抽出をしようとすると、調査の実務上の様々な制約のために、測定上の客観性が犠牲になります*1。以上を、再度、スープの味見でたとえると、

  • かきまぜたスープの味見をしたのはいいが、そのスープが「塩辛い」とか「酸っぱい」とかって、結局味見をした人の主観でしょ?客観的ではないよね?

といったかんじでしょうか。。

スープの「成分」にこだわりを持ったひとをどう説得するか

現実的には、「無作為抽出」と「測定の客観性」はトレードオフの関係にあることが多いのです。あっちを立たすとこっちが立たず。


こういった要因から、無作為抽出にあまり価値を見いださないタイプの人々が現れることは自然なことです。その人たちとは、スープ自体に強いこだわりをもった人々です。


私は、社会調査のアプローチを使って、日本人の英語力(およびその他もろもろ)を推定するという研究をやっていました(今もやっています)が、特に言語学畑・語学畑のひとから、強い違和感を伴った反応を受け止ることもよくありました。曰く、「回答者自身の英語力を、質問紙で聞くのは主観的で不正確だ」。


確かにそのとおりで、観式のテストで測った方がアンケート調査よりも正確なのは間違いないのですが、その場合、前述のトレードオフの関係により、サンプルの無作為性が崩れてしまいます。したがって、上述のような発言は、サンプルの無作為性よりも、測定上の客観性に優先順位を与えている価値観だと言えるでしょう。


どちらを重視するかというのは、究極的に言えば、研究の目的によりけりです(そういう意味で、これを「好みの問題」に回収させてしまうのは間違いです)。この点が無作為抽出の意義を考える上で、非常に重要になってくると思います。


スープの比喩に戻りましょう。もしスープの味見が目的であれば、スープの上澄みだけすくってぺろっと舐めていても、鍋全体のことは一向にわかりません。こういう目的であれば、どんなに苦労してでも、たとえ鍋が直径10メートルあったとしても、鍋をかき回す意義はあります。


一方、もしスープに青酸カリが投げ込まれた疑いがあって、その真偽を調べるのが目的だったら....青酸カリが沈むのか浮くのかは知りませんが、化学的に見て、ありそうな部位に狙いをつけて、ちょろっと採取して、検査に回せばいいのです。かき混ぜる必要はありません。ただし、青酸カリですから、検査は「臭いを嗅ぐ」のような主観的な手法ではなくて、きちんとした客観的な方法に則らなければならないことは言うまでもありません。


つまり、集団全体を知りたいときは、サンプルの代表性(無作為性)を優先し、一方、集団全体を知る必要がないとき(あるいは、理論的に集団の特性がすでに分かっているとき)、かつ、主観的な測定では問題が多いときに、測定上の客観性は、代表性に優越すると考えることができるのではないでしょうか。

*1:誤解のないように付け加えておきますと、「無作為抽出=客観性下がる」ということではありません。あくまで、大きな母集団を相手にした時の種々の困難により客観性が下がるのです。