読者です 読者をやめる 読者になる 読者になる

JEFLL Corpusの使い方

lecture corpus

 この記事は、日本人中学生・高校生約1万人の自由英作文データを集めたJEFLL Corpusの使い方に関する授業資料です(随時更新)。JEFLLの詳細や利用規定に関しては、リンク先を参照してください。また、検索方法に関しては、各自「ヘルプ」を読んでください。

基本的な検索

  • 語句検索
    • "breakfast"を検索すると、別画面に検索結果が表示される
    • 頻度を見るときは、「総件数」(単純頻度)だけでなく、必ず「1M語」あたりの頻度(相対頻度)も見る。
    • 「ソート」をクリックし、「右ソート」もしくは「左ソート」を選ぶと、検索後の右もしくは左に出現している語のアルファベット順でソートされる
    • 「表示変更」で「1文表示」にすることが可能
    • 「語(句)集計」を使い、任意の位置に出現する語(句)を集計することが可能
    • 「ダウンロード」で検索結果の保存が可能
    • 「基本形で検索」にチェックを入れて、"be"を検索すると、be動詞の活用形をまとめて表示される
    • 「出現位置指定」で「文頭」を指定し、"you"を検索すると、文頭で使われているyouだけが表示される
    • "maked"のように文法的に誤った語やミススペリングを検索することも可能
    • "[JP]"を検索すると、英文中で使われている日本語がまとめて表示される
  • 練習問題
    • "want"を検索し、右1語の位置でソートしなさい
    • "want"の左1~右2語までの語句を集計しなさい

発展的な検索

  • 品詞検索
    • "to"を検索する際に、「前置詞」と「to不定詞」を分けて検索することが可能(品詞は、[?]をクリックして選ぶ)
  • 共起検索
    • 中心語に"very"を使用し、コロケーション・テーブル(出現位置ごとに共起語(コロケーション)をまとめた表)を作成
    • 「共起頻度」順だけでなく、「Tスコア」順や「MIスコア」順で表示することも可能(これらの統計指標については、言語統計の基礎(後編)―共起尺度を参照)
    • 共起語の品詞を限定することも可能
  • 単語リスト
    • "go"を検索すると、"went"や"going"などの活用形の頻度もまとめて表示することが可能
  • サブコーパス
    • 語句検索や品詞検索を行う際に、全てのデータを検索対象とせず、一部の学年や学校のみを対象とすることが可能
  • 練習問題
    • 名詞として使われている"watch"の頻度を調べなさい
    • "must"の右1語の位置に出現する動詞を検索し、Tスコアでソートしたときの上位3語を調べなさい
    • 中学1年から高校3年までの6年間で、文頭で接続詞のButが使われる頻度(1M語あたり)がどう推移するかを調べなさい
広告を非表示にする