Profiling developmental patterns of learner language

 3月17〜21日にオーストラリアのパースで開催されたDigital Humanities Australasia 2014において、"Profiling developmental patterns of learner language"という発表 (short paper) をしてきました。そして、その発表スライドが大会のウェブサイトで公開されました。
 この研究の目的は、様々な言語的特徴の使用頻度に注目し、日本人英語学習者のスピーキングがどのように発達していくかを明らかにすることです。分析データには、NICT JLE Corpusにおけるレベル2〜9の学習者データ(1278人分)*1を使用しました。また、分析対象とする言語的特徴としては、Biber (1988) における58種類の言語項目の頻度を用いました。
 以下は、分析データから得られた8レベル×58項目の頻度行列に対して、クラスター分析*2を実行し、ヒートマップを描いた結果です。

f:id:langstat:20140404182659p:plain

 まず、レベルの分類結果に注目すると、右から、(1) レベル2〜3 (Novice)、(2) レベル4〜5 (Intermediate-Low)、(3) レベル6〜9 (Intermediate-Mid) という3つのクラスターが形成されていることが分かります。この結果は、レベルが上がっていくにつれて、学習者のスピーキングの特徴が徐々に変化していくことを示しています。
 次に、言語項目の分類結果に注目すると、大まかに4つのクラスターが形成されていることが分かります。また、この図のヒートマップでは、赤が濃い部分ほど(他のレベルと比べて)高頻度な項目を表し、白や薄い黄色の部分は低頻度な項目を表しています。そして、ヒートマップを参照しつつ、言語項目に関する4つのクラスターを見ると、上から、(1) 使用頻度がレベル6〜9 > レベル4〜5 > レベル2〜3である項目、(2) 使用頻度がレベル4〜9 > レベル2〜3である項目、(3) 使用頻度がレベル9 > レベル6〜8 > レベル4〜5 > レベル2〜3である項目、(4) 使用頻度がレベル2〜3 > レベル4〜5 > レベル6〜9である項目、というパターンが認められます。*3
 このような分析を積み重ねていくことで、日本人英語学習者がスピーキングを学んでいくにあたって「どのあたりのレベルでどのような言語項目に躓くのか」、あるいは「上級者になるためにどのような言語項目をマスターする必要があるのか」といった情報が得られるでしょう。今後は、使用頻度の調査に加えて、実際の使用例の質的分析や誤り分析を行っていく予定です。

  • Mariko Abe & Yuichiro Kobayashi (2014). Profiling developmental patterns of learner language. A paper given at the Digital Humanities Australasia 2014. PDF

*1:レベル1は、3人分しかデータが含まれていないために、除外しました。

*2:ユークリッド距離とウォード法を用いました。

*3:結果の詳細については、スライドのPDFをご覧ください。