星野崇宏 2009 『調査観察データの統計科学』読書会 - こにしき（言葉・日本社会・教育）

（告知期間が終了次第この記事は削除します）

標記の本に関する読書会を行います。

寺沢も参加します。ご興味おありの方は、寺沢までご連絡ください。

ちなみに、どういう本かというと、従来の計量研究の「不正確性」を補正する統計手法に関する解説です。
とくに、実験をしているわけではないのに《実験とみなして統計解析を施す》ということが、外国語教育研究などではよく行われていますが、こうした処置がもたらす「不正確性／危険性」を解決する方法です。

たとえば、「XXX の学習経験者」グループと「非経験者」グループの成績を比較して、有意差の有無を議論したりすることはよくありますが、《学習経験》というものは、その性格上、厳密な実験のように《被験者にランダムに割り当て》られているものではなく、したがってこのようなデータを実験を前提とした統計手法で解析すると様々なバイアスが生じることが知られています。

日本の応用言語学系の研究ではほとんど知られていませんが、経済学やアメリカ社会学ではほぼスタンダードな方法ですので、これから数年で急速に普及するかもしれません。

MLから転載

今般、以下の書籍についての読書会を行う予定ですので、
ご興味のある方は、ご連絡ください。
読書会の日程は未定ですが、参加者の都合に応じて決める予定です。

星野崇宏 (2009) 『調査観察データの統計科学―因果推論・選択バイアス・データ融合』岩波書店。

この本は、さまざまな要因がからみ、どうしても偏り（＝バイアス）を持ってしまう現象について、どうすればうまく統計的に処理できるかについて書かれています。

現在の言語研究の分析方法は、非常に問題が多いと統計学者から指摘されています。この本の著者である星野氏もそのことを指摘しています。

まず、言語教育の場合を考えてみます。たとえば、この書籍に出ていた事例を紹介しましょう。小学校英語の学習経験の有無と英語の能力に関係があるかどうかを調べることを考えてみます。この場合、単純に、小学校英語の学習経験の有無で２グループに分けるだけでは、不適切であると言われています。実際、小学校英語の学習経験の有無にたいしては、経済状況・地域特性などのさまざまな要因が影響しています。こういった影響を除去するためにも、この本の知識が
役に立つかと思います。

また、言語学の場合も同じような問題が起こりえます。コーパスを使った研究はさかんに行われていますが、現在使用可能なコーパスは必ずしもバランスのとれたものではありません。どうしても正式な書き言葉のほうが多く、普通の人が書いた文章はなかなか使えません。また、ジャンル、年齢や性別などにも偏りが見られます。この本に書かれている手法を用いることで、このような偏りを除去し、より適切な研究ができることになるでしょう。

この書籍は、問題意識・論理展開も分かりやすく書かれており、例もできるだけ挙げられており、専門家でなくても読みやすいと思います。ただ、初心者向けの書籍ではないので、ある程度統計を勉強したことがある人でないと、読むのは難しいかと思います。