読者です 読者をやめる 読者になる 読者になる

Rではじめるビジネス統計分析

r

 このたび、『Rではじめるビジネス統計分析』という共著書を翔泳社より刊行することになりました(2014年7月17日刊行予定*1)。

Rではじめるビジネス統計分析

Rではじめるビジネス統計分析

 本書の構成は、以下のとおりです。

  • Chapter01: Rの基本操作
  • Chapter02: データを視覚化する
  • Chapter03: データを要約する
  • Chapter04: データの関連性を見る
  • Chapter05: 未知のデータを予測する
  • Chapter06: データを分類する
  • Chapter07: テキストマイニングを行う
  • Chapter08: ログデータからクラスタ分析を行う

 私は、上記の「Chapter07: テキストマイニングを行う」を担当し、(1) 形態素解析
(2) ワードクラウド、(3) ワードリスト、(4) N-gram分析、(5) 共起語分析、(6) 文書分類などについて執筆いたしました。*2 どこかでお見かけの際には、手に取ってご覧頂ければ幸いです。
 また、本書をきっかけに、より深くテキストマイニングを学んでみたいと思われた方は、以下の本も合わせてご参照くださいませ。

Rで学ぶ日本語テキストマイニング

Rで学ぶ日本語テキストマイニング

 以下は、『Rではじめるビジネス統計分析』の「Chapter07: テキストマイニングを行う」の正誤表です(2014年7月13日更新)。

  • p.306, l.3「MeCabパッケージ」
    • 正しくは、「RMeCabパッケージ」
  • p.328, l.19 「Tを基準に集計結果を並び替える」
    • 正しくは、「共起尺度を計算する」
  • p.328, l.20 「なお、Tを基準に集計結果を並び替えるには」
    • 正しくは、「なお、個々の共起語に関して、TとMIを計算するには」
  • p.328, l.21 「# Tで集計結果を並び替え」
    • 正しくは、「# 共起尺度の計算」
  • p.329, l.4 「Tを基準に並び替えた集計結果を確認してみましょう。」
    • 正しくは、「Tを基準に集計結果を並び替えて、確認してみましょう。」
  • p.333, l.5-6 「(クラスタ分析の詳細に関しては、本書の第6章を参照)」
    • 削除

*1:Amazonにおける発売日は、刊行日の1日後になるそうです。

*2:念のために申し上げておくと、私は、ビジネス業界の人間ではなく、自然言語の研究者です。