2018年11月に購入した本

 以下の本を購入しました。

Sentiment Analysis: Mining Opinions, Sentiments, and Emotions

Sentiment Analysis: Mining Opinions, Sentiments, and Emotions

Sentiment Analysis in Social Networks

Sentiment Analysis in Social Networks

  • 作者: Federico Alberto Pozzi,Elisabetta Fersini,Enza Messina,Bing Liu
  • 出版社/メーカー: Morgan Kaufmann
  • 発売日: 2016/09/16
  • メディア: ペーパーバック
  • この商品を含むブログを見る
Classroom Writing Assessment and Feedback in L2 School Contexts

Classroom Writing Assessment and Feedback in L2 School Contexts

英語コーパス研究シリーズ 第3巻?コーパスと辞書

英語コーパス研究シリーズ 第3巻?コーパスと辞書

数字が明かす小説の秘密 スティーヴン・キング、J・K・ローリングからナボコフまで

数字が明かす小説の秘密 スティーヴン・キング、J・K・ローリングからナボコフまで

データサイエンス入門 (岩波新書)

データサイエンス入門 (岩波新書)

2018年10月に購入した本・ご恵贈頂いた本

 以下の本を購入しました。

Statistics in Corpus Linguistics: A Practical Guide

Statistics in Corpus Linguistics: A Practical Guide

Hedging in Scientific Research Articles (Pragmatics & Beyond New Series)

Hedging in Scientific Research Articles (Pragmatics & Beyond New Series)

サンプリングって何だろう――統計を使って全体を知る方法 (岩波科学ライブラリー)

サンプリングって何だろう――統計を使って全体を知る方法 (岩波科学ライブラリー)

究極の英語ライティング

究極の英語ライティング

 そして、以下の本をご恵贈頂きました。心より感謝を申し上げます。

日本語文法史研究 4

日本語文法史研究 4

CamTESOL 2019から採択通知

 来たる2019年2月15〜17日にカンボジアプノンペンで開催されるCamTESOL 2019に採択されました。私は、15日のRegional ELT Research Symposiumで30分の口頭発表を行う予定です。

  • Yuichiro Kobayashi (2019). Second language discourse in Asian Englishes: A corpus-based approach. CamTESOL 2019.

 例によって急に校務が入る可能性もありますが、、、久しぶりに海外で口頭発表をするのが楽しみです。また、テーマ的にアジア英語の話なので、(特に、東南アジアの参加者から)様々なフィードバックが得られることを期待しています。

2018年9月に購入した本・ご恵贈頂いた本

 以下の本を購入しました。

医療言語処理 (自然言語処理シリーズ)

医療言語処理 (自然言語処理シリーズ)

分割表の統計解析: 二元表から多元表まで (統計ライブラリー)

分割表の統計解析: 二元表から多元表まで (統計ライブラリー)

 そして、以下の本をご恵贈頂きました。心より感謝を申し上げます。

テキストアナリティクス (統計学One Point)

テキストアナリティクス (統計学One Point)

やってみよう テキストマイニング ―自由回答アンケートの分析に挑戦! ―

やってみよう テキストマイニング ―自由回答アンケートの分析に挑戦! ―

Javaで学ぶ自然言語処理と機械学習

Javaで学ぶ自然言語処理と機械学習

『Rによるやさしいテキストマイニング[活用事例編]』という本を刊行します

 10月6日、『Rによるやさしいテキストマイニング[活用事例編]』という書籍を刊行いたします。目次などは出版社のウェブサイトで公開されていますが、ここでは、もう少し詳しくご紹介します。*1

Rによるやさしいテキストマイニング [活用事例編]

Rによるやさしいテキストマイニング [活用事例編]

どうして本書が書かれたのか

 本書は、「Rによるやさしいテキストマイニング」シリーズの3冊目です。1冊目の『Rによるやさしいテキストマイニング』では、プログラミングや統計処理の経験のない初心者を対象に、テキストマイニングで用いられる理論と技術を基礎から丁寧に解説しました。また、2冊目の『Rによるやさしいテキストマイニング[機械学習編]』では、中・上級者向けに、発展的な自然言語処理機械学習の手法を紹介しました。
 シリーズ3冊目となる本書では、実データを用いたテキストマイニングの事例を幅広く紹介し、実際の分析プロジェクトやレポート作成に役立つ「分析のひな形」を提示します*2。具体的には、データの収集から、テキスト整形などの前処理、分析対象とする単語や品詞の頻度集計、分析対象に合わせた統計手法の選定、分析結果の可視化まで、分析プロジェクトにおける一連の流れを省略せずに解説します。また、本書では、アンケートの自由記述、オンラインレビュー、ウェブデータ、政府刊行物、文学作品、政治家の演説など、多種多様なテキストデータを扱い、個々のデータに合わせた分析方法を説明します。
 本書を読むことで,読者は以下のようなことができるようになります。

  • 個々の分析手法をばらばらに学ぶのではなく、複数の分析手法を組み合わせて使う方法を知ることができる
  • 「きれいな」サンプルデータではなく、実際の「汚い」テキストデータを扱うことで、ビジネスや研究などの実務を想定した実践的な技術を学ぶことができる
  • 似たようなデータを分析する場合に、本書で提示しているテキストマイニングの手順と方法をそのまま使うことができる

本書の対象読者は誰か

 本書の主な対象読者は、以下のような方々です。

 まず、本書は、主に文系の初心者の方を想定して書かれています。実際にRでテキストマイニングを行ってみたい方は言うまでもなく、とりあえず「テキストマイニングで何ができるのか」を知りたい方にもおすすめです。また、本書で紹介している幅広い活用事例は、すでにPythonSPSSのような他のツールを使ったテキストマイニングに従事している方々にも参考にして頂けると思います。そして、テキストマイニングを使った卒業論文や講義レポートを書く大学生の手助けになるはずです。さらに、テキストマイニング関連の授業を担当されている先生方にも参考にして頂ける内容となっています。

本書をどのように読むべきか

 第I部「Rによるテキストマイニング」では、テキストマイニングの活用方法、Rの活用方法についての基本的な内容が解説されています。すでにテキストマイニングに従事している方やRの操作に慣れている方は、この部分を読み飛ばしてくださっても構いません。逆に、これからテキストマイニングを始めようと考えている方、テキストマイニングを行ってみたいけれど分析のテーマが思いつかないという方には、最初にお読み頂くことをおすすめします。
 第II部「日本語テキストマイニングの活用事例」と第III部「英語テキストマイニングの活用事例」では、8つの活用事例を紹介しています。大まかに、前半の章では基本的な分析手法を使い、後半の章では発展的な分析手法を用いています。しかし、基本的には、読者の関心に応じて、どこから読んで頂いても構いません(各章の詳細については、こちらTogetterまとめをご覧ください)。なお、各章の末尾には、本文の内容を補足するコラムがあります。
 本書の分析データやコードなどは、サポートサイトで公開されます。Windows版とMac版がありますので、自分が使用するOSに合わせたデータセットをダウンロードしてください。また、本書の記述に誤りが見つかった場合、本書で紹介しているパッケージや関数の仕様が変更になった場合なども、サポートサイトで情報を共有する予定です。

*1:以下の文章は、本書の「はじめに」の一部に加筆修正などを加えたものです。

*2:個人情報や著作権の関係で、一部は「実データを参考に作成されたデータ」となっています。