こにしき(言葉・日本社会・教育)

関西学院大学(2016.04~)の寺沢拓敬のブログです(専門:言語社会学)。

ツイッター上の英語教育言説の構造(2012年1月〜3月)

などというおおげさなタイトルをつけてしまいましたが、この記事は、KH Coder の分析練習日記です。

KH Coder というのは、内容分析(質的データをコーディングによって計量分析する手法)やテキストマイニングができるフリーソフト。以下の樋口耕一先生のサイトで入手できます。
KH Coder: 計量テキスト分析・テキストマイニングのためのフリーソフトウェア


実は私、今年の1月下旬からツイッターで「英語教育」という語を含んだツイートをせっせと収集していました。
昨日までの57日分の計9,030ツイートを用いて、テキストマイニングをしてみます。


なお、収集されたツイートには相当数の公式RT・非公式RT(他人の発言の引用)が含まれています。これの扱いをどうするかという問題がありますが、RTという行為はなんらかの積極的な反応(共感、メモ、晒しあげ)を示していると考え、分析に投入しています。(正規表現を使えば、別段除去することは難しくないので、必要ならやってみてもいいですが)

出現頻度

出現回数順に、各語を並べると次の通り。15位まで並べました。

順位 抽出語 出現回数
1 英語 15599
2 教育 11718
3 日本 3034
4 思う 1713
5 1228
6 日本人 1036
7 小学校 871
8 言う 864
9 自分 748
10 勉強 705
11 大学 649
12 授業 616
13 日本語 610
14 学校 593
15 先生 571


トップ2が、「英語」と「教育」という結果は、「英語教育」という語が含まれているツイートを抽出しているので当然なんですが、3位・6位・13位に「日本」が来るのが示唆的。「日本(人)」というマクロな観点から英語教育を語る、という政策論的なツイートが多いんでしょうか。さすがツイッター民度が高いですね!

多次元尺度構成法

ツイッターのいいところは、1ツイートが最大140字なところ。そういう文字数制限のなかで、ある語とある語が高い確率で一緒に現れていたら、それは関連が強い語だと言えるはずです。

ここでは多次元尺度構成法という、「似てる・似てない」とか「共起する・しない」という関係を、距離と見なして2次元*1空間にプロットする手法で分析。近ければ近いほど、共起しやすいという意味になります。

f:id:TerasawaT:20210314231526p:plain

結果は上の図。いくつかコメント。


右下のに、「最先端」「ノウハウ」「セミナー」(青色のプロット)が固まってますが、これは明らかに販促ツイートですね。


中央部左側に国/国民の名前「中国人」「アメリカ」「韓国」「日本人」が連なってますが、これは一時期さかんにRTされた「国民性ジョーク」の影響を受けてるものだと思います。


あとの真ん中ぐちゃぐちゃした部分はよくわかりません(笑)


というわけで、あんまり「新奇な知見!」は見られないわけですが、今回はかなり大ざっぱに分析したのでこんなものだと思います。実際のテキストデータをじっくり見ながら、丁寧に分析していけばもうすこし面白いことは言えるかも知れません。

もっと単語を増やしてみる!

上の図をみても、「思う」とか「多い」とかの動詞や形容詞の語をみても、共起関係がいまいちピンときません。分析に入れておいてもあまり意味がなさそうなので、名詞だけにしておいたほうがもっとわかりやすくなるでしょう。
また、「英語」と「教育」は、抽出キーワードである以上、真ん中にいくのは当然なのでこれも省きます。
こんどは抽出語数をもっと増やして、出現数100語以上のものを解析の対象にしました。


結果は以下


f:id:TerasawaT:20210314231530p:plain

いくつかコメント

一般的な政策論・学校教育論

真ん中(座標 0,0)に来ているのは、日本・日本語・日本人・国際・海外などの政策系のワードや、学校・文法・学習・教師・先生・学生・高校・大学・小学校などの学校教育に関するワード。このテーマはいろんな話題にも現れるという点で、一般的なキーワードだと考えられます。

「偏在」する「早期英語」言説

対照的に、上の端っこに「幼児」「子ども」「早期」のような早期英語教育を含意する語が集まっています。政策や学校英語教育の話と違って、早期英語の話は、特定の人(一部のツイート)にのみ話題にされる傾向がある、ということが想像できます。

TOEIC/TOEFL

TOEIC(座標軸で (-0.7,-1.2) 辺りの赤い点)と、TOEFL(座標軸 (-1.1, 1) 辺りの黄色い点)かなり遠い。これはけっこう意外。ちなみに「TOEFL」のすぐ左に「センター」がありますが、これは「センター試験TOEFLに変えよ」言説群ですかね。↓


twitter.com



レストランでウェイターに乱暴して通報!?

中央左に不穏な語が固まっています(黄色い点)。通報・乱暴・ウェイター・レストラン・テキスト・スキットなど・・・なんかあったのかと心配になりますが、次のツイートが100回以上もRTされたことによるようです(このページによると150回近く)

twitter.com


ツイッターは拡散力が強いので、こういう「キャッチー」なツイートに反応しやいということが注意すべきだということがわかります。こういうのは、「英語教育言説」における「ノイズ」だと見なして、削除してしまうのもひとつの見識かも知れません。あるいは、前述したように、RTの引用部分は削除して結果への影響を減らすという方法もあるでしょう。

*1:じゃなくてもいいけど