LCR2017から採択通知

 来たる2017年10月5〜5日にイタリアのボルツァーノで開催されるLearner Corpus Research 2017に採択されました。*1 昨年度から採択された「縦断的コーパスの構築と日本人高校生の英語スピーキング力の発達過程の解明」という科研でやっている研究の一部です。

  • Mariko Abe, Yasuhiro Fujiwara & Yuichiro Kobayashi (2017). Tracking L2 language development through construction of a longitudinal spoken learner corpus. Learner Corpus Research 2017.

 私は校務があって残念ながら参加できませんが、もしどなたか参加される方がいらっしゃいましたら、発表にお立ち寄りくださいませ。

*1:採択されたのはだいぶ前ですが、ここに書き忘れていました。

広告を非表示にする

Rによるword2vec

 本日、ディップ株式会社で開催される第63回R勉強会@東京 (Tokyo.R) において、「Rによるword2vec」というLTをします。発表スライドは、こちらから見ることができます。*1

  • 林雄一郎 (2017). 「Rによるword2vec」 第63回R勉強会@東京. slide

 LTなので、非常にざっくりとしか説明していません。Rによるテキスト処理の基本については、手前味噌ですが、以下の本などをご参照ください。Kindle版PDF版もあります。また、もう少しadvancedな内容を扱った続編が秋に出版される予定です。

Rによるやさしいテキストマイニング

Rによるやさしいテキストマイニング

*1:普通にPDFをアップロードすると文字化けしたので、全てのスライドを画像に変換してからアップロードしています。その結果、スライドの解像度が若干落ちています。申し訳ございません。

広告を非表示にする

中古における接続表現の統計的分析―指示詞を構成要素とするものを中心に

 『国立国語研究所論集』(NINJAL Research Papers) というジャーナルに、以下の論文が掲載されました(オープンアクセスですので、こちらからダウンロードすることができます)。

  • 林雄一郎・岡﨑友子 (2017). 「中古における接続表現の統計的分析―指示詞を構成要素とするものを中心に」 『国立国語研究所論集』13, 65-77.
  • 抄録
    • 本研究の目的は,中古資料における接続表現の使用の違いを明らかにすることである。具体的には,「日本語歴史コーパス平安時代編)」と統計手法を活用することで,時代,ジャンル,書き手等の要因による接続表現の頻度の変異を分析した。その結果,(a)紀貫之の筆による『土左日記』と『古今和歌集』(仮名序)の類似性,(b)サテの使用による歌物語の類似性,(c)カカリ系とサテ系の使用法に対する執筆年代の影響,等が見られた。

 なお、本研究の一部は、以下の研究助成を受けて行われたものです。

  • 国立国語研究所共同研究プロジェクト(基幹型)「通時コーパスの構築と日本語史研究の新展開」(代表: 小木曽智信)
  • 科学研究費補助金(基盤研究C)「統計的処理を用いた現代・古代日本語文法研究」 (代表: 岡﨑友子)

2017年6月に購入した本・ご恵贈頂いた本

 以下の本を購入しました。

ETS TOEICの公式問題集LCリスニング 出題機関未公開2017最新実戦質問独占公開

ETS TOEICの公式問題集LCリスニング 出題機関未公開2017最新実戦質問独占公開

ETS TOEICの公式問題集RCリーディング 出題機関未公開2017最新実戦質問独占公開

ETS TOEICの公式問題集RCリーディング 出題機関未公開2017最新実戦質問独占公開

機械学習 ─データを読み解くアルゴリズムの技法─

機械学習 ─データを読み解くアルゴリズムの技法─

Jポップの日本語研究: 創作型人工知能のために

Jポップの日本語研究: 創作型人工知能のために

ベーシック応用言語学

ベーシック応用言語学

1駅1題! TOEIC L&R TEST 読解特急 (TOEIC TEST 特急シリーズ)

1駅1題! TOEIC L&R TEST 読解特急 (TOEIC TEST 特急シリーズ)

 そして、以下の本をご恵贈頂きました。心より感謝を申し上げます。

Rによるテキストマイニング入門

Rによるテキストマイニング入門

Rによる自動データ収集: Webスクレイピングとテキストマイニングの実践ガイド

Rによる自動データ収集: Webスクレイピングとテキストマイニングの実践ガイド

機械学習入門 ボルツマン機械学習から深層学習まで

機械学習入門 ボルツマン機械学習から深層学習まで

Rによるやさしいテキストマイニング増刷(2017年6月)

 おかげさまで、拙著『Rによるやさしいテキストマイニング』が増刷されました。1刷にあった誤記をいくつか修正いたしました。なお、本書の内容や趣旨については、以前書いたこちらの記事をご参照ください。

Rによるやさしいテキストマイニング

Rによるやさしいテキストマイニング

 なお、秋には本書の続編が刊行される予定です。今後ともどうぞよろしくお願い申し上げます。