こにしき(言葉・日本社会・教育)

関西学院大学(2016.04~)の寺沢拓敬のブログです(専門:言語社会学)。

全国英語教育学会と小学校英語教育学会の発表要旨をテキスト・マイニング/テキスト・スマッシング

前口上

今日も元気に中教審の議事録をコピペして整形するだけのお仕事をしています。で、だんだん作業が嫌になってきます。はっきり言って読んでいても楽しくない。

英語教育政策の研究として、こういう基礎的な研究は重要だということは認識しています。ただ、一般メディアのインタビューや商業誌コラムなどで(余技として)政策語りをする研究者が多い割りに、基礎的な研究が驚くほど少ないことにちょっとアレな気持ちです。先輩諸氏、もっと真面目に研究してほしかった。ま、そのおかげで、自分の業績が増えたという話もありますが・・・。

「この業界、動機づけと語彙学習の院生が多すぎる気がする!!!ちょっとこっちに何割か回してほしい!!!」という気持ちを常々抱いているわけですが、実際この印象はどれだけ当たってるのか。ふと思い立ってテキストマイニングしてみることにしました。

神サービス・ユーザーローカル使用

使用したのは、ユーザーローカル・テキストマイニング無料ツール。このサービスは大変高機能です。テキストマイニングの基礎的な機能はだいたい網羅しています。なのに無料。

約10年前、フリーソフトの KH Coder がテキストマイニングのハードルを驚くほど下げましたが(それ以前は商用ソフトは目玉が飛び出るほど高額だった)。そして現在、ユーザーローカルがさらにぐっと下げた形です。ソフトのインストールすらする必要がなく、ウェブで完結するってすごくないですか。

分析はというと、全国英語教育学会と小学校英語教育学会、それぞれの2019年大会のタイトル・発表要旨(予稿集ではなくウェブサイトに載っている数百字の要旨)を使いました。これをフォームにぶちこんで、分析ボタンを押しました。

ちなみに、テキストの下処理はめちゃくちゃ適当です。為念。(PDFをコピペして、改行を削除して、無駄に頻出しがちだと直感で思ったキーワードを正規表現でざっくりと除いただけ)

以下が、結果です。

結果は、こちらの固有リンクからも見れますが、一定期間が過ぎると消えてしまうらしいので、以下にスクリーンショットを貼っておきます。

f:id:TerasawaT:20190806141442p:plain

f:id:TerasawaT:20190806141446p:plain

f:id:TerasawaT:20190806141512p:plain

f:id:TerasawaT:20190806141622p:plain

総評

で、実感をどれだけ裏付けられたかというと、まあ及第点。 全体的に見ると、「語彙」は確かに多い。一方、「動機づけ」は(多いっちゃ多いが)上位には来ませんでした。あと、当たり前ですが、小学校英語の学会では「語彙」は上位には来ません。

あと、全国英語教育学会と小学校英語教育学会の比較については、「まあ、たしかにそうだよな」と思う点がいくつも見つかりました。見つかりましたが、以下略。

これはテキストマイニングではなく、テキスト"スクリーニング"

実はこの程度のことは、テキストマイニングなどをしなくてもわかることです。

正直に告白すれば、マイニング(採掘)というには、看板に偽りありです。 採掘は、地中に埋もれていて、分析なしでは発見できなかった知見(=鉱石)を掘り出すことです。よく知られている当たり前のことについて、見せ方を変えて提示したものを「マイニング」と(原理的には)呼ぶべきではありません。

ところで、英語教育系の学会では最近、振り返りシートとかプログラム後アンケートなどをテキストマイニングする「お作法」が大流行ですが、あれの大半も、マイニング(採掘)の領域に達していません。

よくあるのは、テキストマイニングなどしなくてもわかっていた知見を、「再発見」するもの。言うなれば、テキストスクリーニング(分析器でノイズを取り除いただけ。なぜノイズがわかるかといえば、最初から絵が見えていたから)

また、大量の混沌とした文章を、分析器で分解して、少量ではあるがやはり依然として混沌とした文字列に置き換えただけのもの(テキスト・スマッシング text-smashing)。ソフトが出力した図だけをバーンッと見せるだけでたいした解釈はしない。テキストを壊して並べただけ。

何となく科学的な装いをしているため、画期的な手法だと感じて手を出す院生の人がいるのもわからんではないですが、そもそも自分がやろうとしていることに合っているかどうか見極めてほしいものです。

そのためにも、とりあえず体験してみて、テキストマイニングでどんなことがわかるのか(どんなことであればわからないのか)を理解しておくべきでしょう。その点で、ファーストステップのハードルが異常に低い、ユーザーローカルテキストマイニングは便利です。