The similarity and difference between human scoring and automated scoring

 9月27日(金)、ソウルの祥明大学校で開催されたApplied Linguistics Association of Korea (ALAK) の国際大会において、"The similarity and difference between human scoring and automated scoring"という発表をしてきました。
 内容的には、3月末に「機械学習と自然言語処理の技術を用いた習熟度推定―現状と課題」という文章で報告した結果などを用いて、人間による採点と機械による採点の類似点と相違点について議論しました。
 上記の文章にも書いたように、人間による採点と機械による採点の両方において、人間も機械も総語数や異語数が採点に大きく寄与していることが分かりました。それが本当の相関関係なのか、疑似相関関係なのかについては、偏相関係数などを詳しく調べていく予定です。*1

f:id:langstat:20140921181535p:plain

*1:因みに、今回の発表では、ランダムフォレストにおけるジニ係数の平均減分で寄与度を推定しており、相関係数を使っている訳ではありません。