2018年1月に購入した本・ご恵贈頂いた本

以下の本を購入しました。Corpora and Language Teaching (Studies in Corpus Linguistics)作者: Karin Aijmer出版社/メーカー: John Benjamins Pub Co発売日: 2009/01/14メディア: ペーパーバック クリック: 2回この商品を含むブログ (1件) を見るExploring…

Developmental patterns of metadiscourse in second language writing

Journal of Pan-Pacific Association of Applied Linguisticsというジャーナルに、以下の論文が掲載されました(こちらからダウンロードすることができます)。 Yuichiro Kobayashi (2017). Developmental patterns of metadiscourse in second language wri…

立命館大学言語学研究会 (Day2)

以下は、立命館大学言語学研究会のR講習会に関するメモです*1。 記述統計 まずは、平均値、中央値、分散、標準偏差などの記述統計を求めてみましょう。 x <- c(1, 2, 3, 4, 5) # 平均値 mean(x) # 中央値 median(x) # グループAの5人の年収の調査(単位は万…

立命館大学言語学研究会 (Day1)

以下は、立命館大学言語学研究会のR講習会に関するメモです*1。 Rの準備 参考ウェブサイト R: The R Project for Statistical Computing(公式サイト) Rのインストールと超入門 (PDF) Talks by sakaue - Speaker Deck(R BootCampの資料) Rはいいぞ!むし…

ワードクラウドは本当にわかりやすい可視化の方法なのか?

近年、テキストマイニングの結果をワードクラウドと呼ばれる方法で可視化するのが流行しています。 文章中で出現頻度が高い単語を複数選び出し、その頻度に応じた大きさで図示する手法。ウェブページやブログなどに頻出する単語を自動的に並べることなどを指…

2017年12月に購入した本

以下、順不同です。Lexical Bundles in Native and Non-Native Scientific Writing: Applying a Corpus-Based Study to Language Teaching (Studies in Corpus Linguistics)作者: Danica Salazar出版社/メーカー: John Benjamins Pub Co発売日: 2014/11/26メ…

2017年11月に購入した本

以下、順不同です。Linguistic Variation in Research Articles: When discipline tells only part of the story (Studies in Corpus Linguistics)作者: Bethany Gray出版社/メーカー: John Benjamins Pub Co発売日: 2015/12/17メディア: ハードカバーこの商…

Pythonに関するメモ

数年ぶりにPythonを勉強し直そうと思い*1、自分用のメモを作りました(随時更新)。 環境構築 Pythonの環境構築 on Mac ( pyenv, virtualenv, anaconda, ipython notebook ) pyenvでpythonをインストールしてちょっと詰まった(pipが入っていない場合の対処…

2017年10月に購入した本

以下、順不同です。ベイズ統計モデリング: R,JAGS, Stanによるチュートリアル 原著第2版作者: John K. Kruschke,前田和寛,小杉考司出版社/メーカー: 共立出版発売日: 2017/07/22メディア: 大型本この商品を含むブログを見るRではじめる機械学習 データサイズ…

文章を科学する

まもなく、李在鎬先生が編集された『文章を科学する』が出版されます。私は、第9章「英語の自動作文評価」を執筆いたしました。詳しい目次などは、以下をご覧くださいませ。 第1部 理論編 文章を科学する視点 1. 文章の科学が目指すもの 李在鎬 2. 文章とは…

英語の類語を使い分けるために(動詞+名詞編)

来たる11月11日(土)、日本医科大学で、学術英語学会定期セミナー(第1回)「英語の類語を使い分けるために(動詞+名詞編)」を担当いたします。本セミナーの概要は、以下のとおりです。 非母語話者が英語で論文を書く際,類語の使い分けが非常に大きな問題…

コーパスと多様な関連領域

まもなく、英語コーパス研究シリーズ第7巻『コーパスと多様な関連領域』が出版されます。私は、第6章「コーパスと統計処理」を執筆いたしました。詳しい目次などは、以下をご覧くださいませ。 I コーパスと多様な関連領域 赤野一郎・堀正広 1. はじめに 2. …

2017年9月に購入した本・ご恵贈頂いた本

以下の本を購入しました。Text Mining With R: A Tidy Approach作者: Julia Silge,David Robinson出版社/メーカー: Oreilly & Associates Inc発売日: 2017/07/02メディア: ペーパーバックこの商品を含むブログ (1件) を見るアンサンブル法による機械学習: 基…

『Rによるやさしいテキストマイニング[機械学習編]』という本を刊行します

9月21日、『Rによるやさしいテキストマイニング[機械学習編]』という書籍を刊行いたします。目次などは出版社のウェブサイトで公開されていますが、ここでは、もう少し詳しくご紹介します。*1 Rによるやさしいテキストマイニング: 機械学習編作者: 小林雄…

Investigating the chronological variation of popular song lyrics through lexical indices

Journal of the Japanese Association for Digital Humanitiesに以下の論文が掲載されました(こちらからダウンロードすることができます)。 Yuichiro Kobayashi, Misaki Amagasa, & Takafumi Suzuki (2017). Investigating the chronological variation of…

2017年8月に購入した本・ご恵贈頂いた本

以下の本を購入しました。Text Mining in Practice with R作者: Ted Kwartler出版社/メーカー: Wiley発売日: 2017/07/24メディア: ハードカバーこの商品を含むブログを見る退屈なことはPythonにやらせよう ―ノンプログラマーにもできる自動化処理プログラミ…

機械学習を用いたコーパス分析入門

来たる9月30日~10月1日、関西学院大学で英語コーパス学会第43回大会が開催されます。*1 私は、2日目の午前中に「機械学習を用いたコーパス分析入門」というワークショップを担当いたします。非会員の方でも参加可能ですので、ご興味があればご参加ください…

『仕事に使えるクチコミ分析ーテキストマイニングと統計学をマーケティングに活用する』という本を刊行します

来月、『仕事に使えるクチコミ分析ーテキストマイニングと統計学をマーケティングに活用する』という単著を刊行いたします 。仕事に使えるクチコミ分析[テキストマイニングと統計学をマーケティングに活用する]作者: 小林雄一郎出版社/メーカー: 技術評論社…

IFCS 2017の特別セッション

来たる2017年8月8〜10日に東海大学で行われる国際分類学会 (Conference of the International Federation of Classification) において、私が座長を務める"Text Classification"という特別セッションがあります。*1 このセッションでは、以下の5件の発表があ…

2017年7月に購入した本・ご恵贈頂いた本

以下の本を購入しました。もうひとつの重回帰分析作者: 豊田秀樹出版社/メーカー: 東京図書発売日: 2017/06/08メディア: 単行本この商品を含むブログを見る公式 TOEIC Listening & Reading トレーニング リスニング編作者: Educational Testing Service出版…

LCR2017から採択通知

来たる2017年10月5〜5日にイタリアのボルツァーノで開催されるLearner Corpus Research 2017に採択されました。*1 昨年度から採択された「縦断的コーパスの構築と日本人高校生の英語スピーキング力の発達過程の解明」という科研でやっている研究の一部です。…

Rによるword2vec

r

本日、ディップ株式会社で開催される第63回R勉強会@東京 (Tokyo.R) において、「Rによるword2vec」というLTをします。発表スライドは、こちらから見ることができます。*1 小林雄一郎 (2017). 「Rによるword2vec」 第63回R勉強会@東京. slide LTなので、非…

中古における接続表現の統計的分析―指示詞を構成要素とするものを中心に

『国立国語研究所論集』(NINJAL Research Papers) というジャーナルに、以下の論文が掲載されました(オープンアクセスですので、こちらからダウンロードすることができます)。 小林雄一郎・岡﨑友子 (2017). 「中古における接続表現の統計的分析―指示詞を…

2017年6月に購入した本・ご恵贈頂いた本

以下の本を購入しました。ETS TOEICの公式問題集LCリスニング 出題機関未公開2017最新実戦質問独占公開作者: ETS,Educational Testing Service出版社/メーカー: ETS発売日: 2017メディア: ペーパーバックこの商品を含むブログを見るETS TOEICの公式問題集RC…

Rによるやさしいテキストマイニング増刷(2017年6月)

r

おかげさまで、拙著『Rによるやさしいテキストマイニング』が増刷されました。1刷にあった誤記をいくつか修正いたしました。なお、本書の内容や趣旨については、以前書いたこちらの記事をご参照ください。Rによるやさしいテキストマイニング作者: 小林雄一郎…

小学校で英語を教えるためのミニマム・エッセンシャルズ

来たる6月26日、『小学校で英語を教えるためのミニマム・エッセンシャルズ―小学校外国語科内容論』という共著書が出版されます。小学校で英語を教えるためのミニマム・エッセンシャルズ 小学校外国語科内容論作者: 酒井英樹,滝沢雄一,亘理陽一出版社/メーカ…

2017年5月に購入した本・ご恵贈頂いた本

以下の本を購入しました。Mastering Text Mining with R作者: Ashish Kumar,Avinash Paul出版社/メーカー: Packt Publishing発売日: 2016/12/28メディア: ペーパーバックこの商品を含むブログを見るデータで学ぶ日本語学入門作者: 計量国語学会出版社/メーカ…

第1回 R初心者2日講習会 (R Two-Day Camp)

来たる2017年7月1~2日、幕張テクノガーデンで「R初心者2日間講習会」を開催します。本ワークショップは、2017年3月にも5日間連続の合宿形式で開催し、おかげさまで満席となりました。*1 今回は、週末に2日間、Rというデータ解析ツールのインストールや基本…

RとApache OpenNLPではじめる自然言語処理

本日、リクルートで開催される第61回R勉強会@東京 (Tokyo.R) において、「RとApache OpenNLPではじめる自然言語処理」というLTをします。発表スライドは、こちらから見ることができます。*1 小林雄一郎 (2017). 「RとApache OpenNLPではじめる自然言語処理…

特定の品詞の共起語だけをワードクラウドに描画する

r

拙著『Rによるやさしいテキストマイニング』の読者の方から、以下のような質問を頂きました。@langstat 先生の本を買って今独学中です。色々できて、達成感を感じています。ありがとうございます。一つお伺いしたいですが、共起語について、N-gram, collocat…