2018年9月に購入した本・ご恵贈頂いた本

 以下の本を購入しました。

医療言語処理 (自然言語処理シリーズ)

医療言語処理 (自然言語処理シリーズ)

分割表の統計解析: 二元表から多元表まで (統計ライブラリー)

分割表の統計解析: 二元表から多元表まで (統計ライブラリー)

 そして、以下の本をご恵贈頂きました。心より感謝を申し上げます。

テキストアナリティクス (統計学One Point)

テキストアナリティクス (統計学One Point)

やってみよう テキストマイニング ―自由回答アンケートの分析に挑戦! ―

やってみよう テキストマイニング ―自由回答アンケートの分析に挑戦! ―

Javaで学ぶ自然言語処理と機械学習

Javaで学ぶ自然言語処理と機械学習

『Rによるやさしいテキストマイニング[活用事例編]』という本を刊行します

 10月6日、『Rによるやさしいテキストマイニング[活用事例編]』という書籍を刊行いたします。目次などは出版社のウェブサイトで公開されていますが、ここでは、もう少し詳しくご紹介します。*1

Rによるやさしいテキストマイニング [活用事例編]

Rによるやさしいテキストマイニング [活用事例編]

どうして本書が書かれたのか

 本書は、「Rによるやさしいテキストマイニング」シリーズの3冊目です。1冊目の『Rによるやさしいテキストマイニング』では、プログラミングや統計処理の経験のない初心者を対象に、テキストマイニングで用いられる理論と技術を基礎から丁寧に解説しました。また、2冊目の『Rによるやさしいテキストマイニング[機械学習編]』では、中・上級者向けに、発展的な自然言語処理機械学習の手法を紹介しました。
 シリーズ3冊目となる本書では、実データを用いたテキストマイニングの事例を幅広く紹介し、実際の分析プロジェクトやレポート作成に役立つ「分析のひな形」を提示します*2。具体的には、データの収集から、テキスト整形などの前処理、分析対象とする単語や品詞の頻度集計、分析対象に合わせた統計手法の選定、分析結果の可視化まで、分析プロジェクトにおける一連の流れを省略せずに解説します。また、本書では、アンケートの自由記述、オンラインレビュー、ウェブデータ、政府刊行物、文学作品、政治家の演説など、多種多様なテキストデータを扱い、個々のデータに合わせた分析方法を説明します。
 本書を読むことで,読者は以下のようなことができるようになります。

  • 個々の分析手法をばらばらに学ぶのではなく、複数の分析手法を組み合わせて使う方法を知ることができる
  • 「きれいな」サンプルデータではなく、実際の「汚い」テキストデータを扱うことで、ビジネスや研究などの実務を想定した実践的な技術を学ぶことができる
  • 似たようなデータを分析する場合に、本書で提示しているテキストマイニングの手順と方法をそのまま使うことができる

本書の対象読者は誰か

 本書の主な対象読者は、以下のような方々です。

 まず、本書は、主に文系の初心者の方を想定して書かれています。実際にRでテキストマイニングを行ってみたい方は言うまでもなく、とりあえず「テキストマイニングで何ができるのか」を知りたい方にもおすすめです。また、本書で紹介している幅広い活用事例は、すでにPythonSPSSのような他のツールを使ったテキストマイニングに従事している方々にも参考にして頂けると思います。そして、テキストマイニングを使った卒業論文や講義レポートを書く大学生の手助けになるはずです。さらに、テキストマイニング関連の授業を担当されている先生方にも参考にして頂ける内容となっています。

本書をどのように読むべきか

 第I部「Rによるテキストマイニング」では、テキストマイニングの活用方法、Rの活用方法についての基本的な内容が解説されています。すでにテキストマイニングに従事している方やRの操作に慣れている方は、この部分を読み飛ばしてくださっても構いません。逆に、これからテキストマイニングを始めようと考えている方、テキストマイニングを行ってみたいけれど分析のテーマが思いつかないという方には、最初にお読み頂くことをおすすめします。
 第II部「日本語テキストマイニングの活用事例」と第III部「英語テキストマイニングの活用事例」では、8つの活用事例を紹介しています。大まかに、前半の章では基本的な分析手法を使い、後半の章では発展的な分析手法を用いています。しかし、基本的には、読者の関心に応じて、どこから読んで頂いても構いません(各章の詳細については、こちらTogetterまとめをご覧ください)。なお、各章の末尾には、本文の内容を補足するコラムがあります。
 本書の分析データやコードなどは、サポートサイトで公開されます。Windows版とMac版がありますので、自分が使用するOSに合わせたデータセットをダウンロードしてください。また、本書の記述に誤りが見つかった場合、本書で紹介しているパッケージや関数の仕様が変更になった場合なども、サポートサイトで情報を共有する予定です。

*1:以下の文章は、本書の「はじめに」の一部に加筆修正などを加えたものです。

*2:個人情報や著作権の関係で、一部は「実データを参考に作成されたデータ」となっています。

英語コーパス学会DDL SIGシンポジウム 2018

 来たる2018年12月15日(土)、早稲田大学英語コーパス学会DDL (Data-Driven Learning) SIGシンポジウム 2018が開催されます。会場は大隈記念講堂小講堂で、時間は13:00〜17:50です。主なプログラムは、以下のとおりです。なお、本シンポジウムの参加申し込みは、こちらからお願いいたします。

  • セッション1: DDLツールの開発と授業への導入 (13:00-14:30)
    • アントニ・ローレンス「ESPの授業におけるデータ駆動型学習 (DDL) の導入」(講演)
    • 西垣知佳子・赤瀬川史朗・石井雄隆「小学校英語のためのDDLツールの開発と活用」(ワークショップ)
  • セッション2: DDLの教育効果 (14:40-17:00)
    • 濱田彰・小林雄一郎「データ駆動型文法学習を促進する英語例文の特徴―学習者による主観的評価のモデリングから」
    • 若松弘子「英語文法学習に適した日本語対訳の条件と制約―日英パラレルコーパスを利用した効果的DDLをめざして」
    • 中條清美「教育用例文コーパスSCoREはどの程度文法参考書をカバーするか」
    • 佐竹由帆「データ駆動型学習 (DDL) を用いた誤り修正タスクの学習効果―冠詞・前置詞を中心に」
    • Gregory Hadley「Using the Oxford Bookworms Corpus for Creating Better Placement Tests」
  • セッション3: DDLとテクノロジーの融合 (17:10-17:50)
    • 水本篤「データ駆動型学習 (DDL) を英語論文執筆サポートに活用する試み」(講演)

2018年8月に購入した本

 以下の本を購入しました。

「日本人と英語」の社会学 −−なぜ英語教育論は誤解だらけなのか

「日本人と英語」の社会学 −−なぜ英語教育論は誤解だらけなのか

「なんで英語やるの?」の戦後史 ??《国民教育》としての英語、その伝統の成立過程

「なんで英語やるの?」の戦後史 ??《国民教育》としての英語、その伝統の成立過程

英語論文ライティング教本 ―正確・明確・簡潔に書く技法― (KS語学専門書)

英語論文ライティング教本 ―正確・明確・簡潔に書く技法― (KS語学専門書)

2018年7月に購入した本

 以下の本を購入しました。

RユーザのためのRStudio[実践]入門−tidyverseによるモダンな分析フローの世界−

RユーザのためのRStudio[実践]入門−tidyverseによるモダンな分析フローの世界−

[音声DL] TOEIC L&Rテスト Part2 応答問題 でる600問

[音声DL] TOEIC L&Rテスト Part2 応答問題 でる600問

TOEIC L&R TEST 初心者特急 パート3 (TOEIC TEST 特急シリーズ)

TOEIC L&R TEST 初心者特急 パート3 (TOEIC TEST 特急シリーズ)

TOEIC L&R TEST 初心者特急 パート4 (TOEIC TEST 特急シリーズ)

TOEIC L&R TEST 初心者特急 パート4 (TOEIC TEST 特急シリーズ)