nlp

PAAL 2018から採択通知

来たる2018年8月21〜23日に東京で開催されるThe Conference of Pan-Pacific Association of Applied Linguistics (PAAL) 2018に採択されました。現在、研究分担者として参画している科研プロジェクトで収集しているスピーキングデータを使った研究報告です。…

Development of acceptability rating data for Japanese (ARDJ): An initial report

来たる3月12日~16日、岡山コンベンションセンターで言語処理学会第24回年次大会 (NLP2018) が開催されます。そして、3月13日の午前中に、私も共著者になっている発表があります*1。ご関心のある方は、是非お越しくださいませ。 黒田航・横野光・阿部慶賀・…

ワードクラウドは本当にわかりやすい可視化の方法なのか?

近年、テキストマイニングの結果をワードクラウドと呼ばれる方法で可視化するのが流行しています。 文章中で出現頻度が高い単語を複数選び出し、その頻度に応じた大きさで図示する手法。ウェブページやブログなどに頻出する単語を自動的に並べることなどを指…

『Rによるやさしいテキストマイニング[機械学習編]』という本を刊行します

9月21日、『Rによるやさしいテキストマイニング[機械学習編]』という書籍を刊行いたします。目次などは出版社のウェブサイトで公開されていますが、ここでは、もう少し詳しくご紹介します。*1 Rによるやさしいテキストマイニング: 機械学習編作者: 小林雄…

『仕事に使えるクチコミ分析ーテキストマイニングと統計学をマーケティングに活用する』という本を刊行します

来月、『仕事に使えるクチコミ分析ーテキストマイニングと統計学をマーケティングに活用する』という単著を刊行いたします 。仕事に使えるクチコミ分析[テキストマイニングと統計学をマーケティングに活用する]作者: 小林雄一郎出版社/メーカー: 技術評論社…

RとApache OpenNLPではじめる自然言語処理

本日、リクルートで開催される第61回R勉強会@東京 (Tokyo.R) において、「RとApache OpenNLPではじめる自然言語処理」というLTをします。発表スライドは、こちらから見ることができます。*1 小林雄一郎 (2017). 「RとApache OpenNLPではじめる自然言語処理…

Rによる感情分析

本日、サイバーエージェントで開催される第60回R勉強会@東京 (Tokyo.R) において、「Rによる感情分析」というLTをします。発表スライドは、こちらから見ることができます。*1 小林雄一郎 (2017). 「Rによる感情分析」 第60回R勉強会@東京. slide LTなので…

『Rによるやさしいテキストマイニング』という本を刊行します

2月17日、『Rによるやさしいテキストマイニング』という単著を刊行いたします。目次などは出版社のウェブサイトで公開されていますが、ここでは、もう少し詳しくご紹介します。*1Rによるやさしいテキストマイニング作者: 小林雄一郎出版社/メーカー: オーム…

Rで英文に品詞情報を付与する

Rで英文に品詞情報を付与したいときは、openNLPパッケージを利用します。このパッケージの関数を使うと、Apache OpenNLP Maxent Part of Speech taggerによる品詞情報付与を行うことができます。以下の例では、Rの公式ウェブサイトから取った文に品詞タグを…

文章を自動要約する

r nlp

Rで文章の自動要約をするには、LSAfunパッケージのgenericSummary関数を使います。この関数を使うと、文章全体を最も的確に表すk個の文を抽出することができます。以下は、Rogue OneのWikipedia記事(英語版)の一部を使った例です。 # パッケージの読み込み…

Automated scoring of L2 spoken English with random forests

Journal of Pan-Pacific Association of Applied Linguisticsに以下の論文が掲載されました(こちらからダウンロードすることができます)。 Yuichiro Kobayashi & Mariko Abe (2016). Automated scoring of L2 spoken English with random forests. Journal…

言語処理学会第23回年次大会

言語処理学会第23回年次大会(3月13~17日、筑波大学)の情報がこちらで発表されました。今大会の主なスケジュールは、以下の通りです。多くの方々の投稿をお待ちしております。 チュートリアル応募締切: 2016年10月14日(金) テーマセッション / ワークシ…