こにしき(言葉・日本社会・教育)

関西学院大学(2016.04~)の寺沢拓敬のブログです(専門:言語社会学)。

二次分析研究で学会発表を申し込みしたら「調査が7年前のものでデータが古い」と言われて不採択になった話。

卒論・修論の締め切りが近づくにつれて、「ネットでアンケートをばらまく卒論・修論をどうにかせえよ」という話が話題になります(参考:卒論のためTwitterのアンケートやグーグルフォームで調査しようとする学生が出てくる時期→まずいので大学教員は指導して - Togetter)。

最近では、「自分で調査するよりも、社会調査アーカイブから質の高い調査データをダウンロードして、二次分析したほうがだいぶまし」みたいな声も聞かれるようになりました。

私もD1のころからこの二次分析をずっとやってきたので、もっとその意義が周知されてほしいなあと思います。

とはいえ、先日、アメリカ応用言語学会に出したプロポーザル(言語政策枠)でも、査読者から「これはあなたが集めたデータなのか他人のデータなのかわからない」という批判コメントをもらいました。ちゃんと secondary analysis と書いてあったのに・・・。

二次分析は、社会科学(経済学、計量政治学、計量社会学)では、市民権を得ている手法だと思いますが、言語政策研究では(政策研究なのに!)、あまり知名度が高くないようです。そういえば、こちらのリサーチメソドロジーの教科書にも記載がありませんでした。

その流れで、2013年に日本言語政策学会から、やはり「発表不採択」を受けたことも思い出しました。不採択理由は完全に二次分析というリサーチメソッドの無理解に起因するものだと今でも思っています。それ以上に、「他者からデータの提供を受けるのはずるい。データは自分で汗水たらして集めるべきだ」という根性主義、もとい、プロセス重視志向が垣間見られます。

当時は、専業非常勤だったこともあり、かなり抑えめの筆致で反論を書いていますが、正直、本当に呆れてしまいました。ちなみに、これを理由として、この直後に、同学会は退会しました。

もう時効だと思うので、プライバシーに関係するところは削除しつつ、こちらに転載します(読者の便を考えてポイントを私が太字にしています)。

最初のほうは、単なる「揉め事」ですが、方法論的な話としては、(4) は参考になるかもしれません。


(1) 2013/04/22 3:32 学会事務局→寺沢

寺沢先生、

 お返事遅くなり大変申し訳ありません。また、前回のメールにつきまして、曖昧な表現がありましたことお詫び申し上げます。寺沢先生にはいつもJALPの大会発表や紀要に応募してくださり感謝しております。

 さて、2013年度の大会発表についてですが、ポスターだけでなく一般発表の可能性も含めて審議いたしましたが、前回のメールでも書きましたように、残念ながら今回は発表を見合わせていただくことが大会委員会で決まりました。視点はおもしろいのですが、データが2007年となっておりますので、今後の発表の際は、2007年以降のデータを使われたものを期待しております

 お答えになっておりましたら幸いです。それでは今後とも、JALPの大会や地区研究会に奮ってご応募をお願いします。

大会担当理事

****

(2) 2013/04/22 3:51 寺沢→学会事務局

****先生

お忙しいなか、お返事をどうもありがとうございました。

・拙発表は、「不採択」で

その理由は、「使用するデータが古いから

という理解でよろしいでしょうか。

お返事頂けましたら幸いに存じます。

寺沢

(3) 2013/04/22 6:13 学会事務局→寺沢

寺沢先生、

 はい、大変申し訳ないのですが、今回は不採択となりました。データなのですが、前回の先生のご発表は、2010年のデータを使っており大変参考になりました。もちろん、一概に古いデータを使ってはいけないと言っているわけではありません。例えば、2007年のデータを使われた場合でも、先生ご自身のアンケートデータなどと組み合わせたり、他のデータベースからとったより最近のデータと組み合わせたりすれば、さらに興味深い研究になると思いますが、いかがでしょうか。

**

(4) 2013/04/23 6:24 寺沢→学会事務局

**先生、

お忙しいなかお返事をありがとうございました。

査読者みなさまのご意見ということでよろしいでしょうか。ご意見、ありがたく頂戴致しました。

ただし、以下の理由から、2007年以降のデータを用いて同様の発表をすることは不可能ですので、たいへん残念ですが、今後の発表は遠慮させて頂きます。

1. 「2006年」の必然性

私の問題関心、つまり「第2外国語に関する日本社会の意識」を無作為抽出で調査したデータは、現在、2006年の日本版総合的社会調査しか存在しません。

したがって、2007年以降のデータを分析することは不可能です。

ちなみに、無作為抽出でこの変数を調査したものは、世界的にもあまり例がなく、2006年であれ何年であれ、たいへん貴重なデータだと思います。(教室等でアンケートをばらまくような有意抽出調査はすでに多数ありますが、そのような手法で日本社会の「実態」を推論することは、一般的に不可能であるとされていると思います)

2.「7年前=古い」と言えるかは微妙な問題

無作為抽出データの2次分析において、一般的に、5~6年前のデータが用いられることはよくあることです。なぜなら、一般的に、調査設計を担当した研究者による「1次分析」が一段落し、データがアーカイブに寄託・公開されてから、はじめて「2次分析」は可能になるからです。調査にもよりますが、調査実施から数年で公開されるようなデータはほとんどありません。たとえば、『Language Policy』誌に2006年に掲載されたJohn Robinsonらの論文は、米国GSSの2000年版のデータを分析しています。そのタイムラグは6年です。

なお、2012年度JALP大会で私が2010年のデータを分析できたのは、私自身がJGSS-2010のプロジェクトメンバーだったからであり、あれは例外的な状況です。

寺沢


このゴタゴタを読んで、二次分析に関心が湧いた方は、以下の記事をぜひお読みください。

方法論的なポイントを丁寧に説明しています。

terasawat.hatenablog.jp