読者です 読者をやめる 読者になる 読者になる

2016年度 言語処理論B (Day 3)

以下は、東京外国語大学の集中講義「言語処理論B」に関するメモです。 Class 11~15: 個人研究 データ収集 この授業では、「Rを用いた日本語もしくは英語の分析」というテーマのレポートを書いてもらう予定です。細かいテーマ設定などは自由で、可能な限り、…

2016年度 言語処理論B (Day 2)

以下は、東京外国語大学の集中講義「言語処理論B」に関するメモです。 Class 6: 多変量解析(の続き) 判別分析とは、任意のデータ(目的変数)の属性をそれ以外のデータ(説明変数)を手がかりとして予測する手法です。以下では、Rにあらかじめ格納されてい…

2016年度 言語処理論B (Day 1)

以下は、東京外国語大学の集中講義「言語処理論B」に関するメモです。 Class 1: イントロダクション この授業の目的は、文系学生が卒業研究などで用いるデータ処理技術を習得することです。具体的には、(1) Rによるプログラミングの基礎、(2) さまざまなグラ…

SegmentAntとAntConcによる日本語テキストの解析

日本語のテキストを解析する場合、一般的に、(1) 文章を単語単位に分かち書きし、(2) 単語の頻度や用例を分析する、という2段階の手順が取られます。 文章の分かち書き 日本語の文章は、単語と単語の間に区切りがなく、コンピュータで単語を分析する場合に不…

Rlingパッケージのインストール

Rによる言語データ分析の教科書であるLevshina (2015) では、Rlingという独自のパッケージが用いられています。Rlingパッケージは、この本のサポートサイトのR Packageというページからダウンロードすることができます。サポートサイトには複数のインストー…

R入門 (3)

この記事は、R入門 (2) の続きです。以下、授業の補足資料です。 対応分析 前回は、重回帰分析や判別分析を用いて、目的変数を含んだデータを解析しました。しかし、全てのデータに目的変数が含まれているわけではありません。そのような場合には、いくつか…

R入門 (2)

この記事は、R入門 (1) の続きです。以下、授業の補足資料です。 重回帰分析 重回帰分析を用いると、任意のデータ(目的変数)がそれ以外のデータ(説明変数)とどのような関係にあるかを明らかにすることができます。以下では、Rにあらかじめ格納されている…

R入門 (1)

Rは、統計解析のためのプログラミング言語です。フリーウェアなので、誰でも自由に入手・使用することができます。公式サイトはこちらで、Wikipediaの記事はこちらです。以下、授業の補足資料です。 簡単な計算と関数 まず、Rのコンソール画面の入力に慣れる…

JEFLL Corpusの使い方

この記事は、日本人中学生・高校生約1万人の自由英作文データを集めたJEFLL Corpusの使い方に関する授業資料です(随時更新)。JEFLLの詳細や利用規定に関しては、リンク先を参照してください。また、検索方法に関しては、各自「ヘルプ」を読んでください。 …

メディアコミュニケーション学演習(2016年度)

これは、東洋大学社会学部のゼミ「メディアコミュニケーション学演習I9」のサポートサイトです(随時更新)。詳しい授業内容については、シラバスを参照してください。*1 また、時間の経過によって、リンク切れとなる可能性があることをご了承ください。(最…

人間―機械コミュニケーション論(2016年度)

これは、東洋大学社会学部の講義「人間―機械コミュニケーション論」のサポートサイトです(随時更新)。詳しい授業内容については、シラバスを参照してください。*1 また、時間の経過によって、リンク切れとなる可能性があることをご了承ください。(最終更…

J-POPの歌詞から見る社会

来たる3月29日(火)、東洋大学の“学び”LIVEで50分間の公開授業をすることになりました。このイベントは、11学部44学科の教員が1日で約100講座を公開するものです。私は、1限 (10:30-11:20) に、歌詞分析の授業をすることにしました。*1 小林雄一郎 (2016). …

2015年度 言語情報処理論/言語処理論B (Day 3)

以下は、東京外国語大学の集中講義「言語情報処理論/言語処理論B」に関するメモです。 Class 11~12: 日本語の分析 この時間では、RMeCabパッケージを用いて、日本語データの解析を行います。*1 教材としては、主に以下のブログ記事を使います。 RMeCabを使…

2015年度 言語情報処理論/言語処理論B (Day 2)

以下は、東京外国語大学の集中講義「言語情報処理論/言語処理論B」に関するメモです。 Class 6~7: グラフィックス この時間では、主に以下の内容を扱います(テキストの6章)。 高水準作画関数 ヒストグラム 箱ひげ図 円グラフ 棒グラフ 散布図 線グラフ …

2015年度 言語情報処理論/言語処理論B (Day 1)

以下は、東京外国語大学の集中講義「言語情報処理論/言語処理論B」に関するメモです。 Class 1: イントロダクション この授業の目的は、文系学生が卒業研究などで用いるデータ処理技術を習得することです。具体的には、(1) Rによるプログラミングの基礎、(2…

2015年度 合同ゼミ論集

私が担当しているメディアコミュニケーション学演習I9(2年ゼミ)、メディアコミュニケーション学基礎演習7(1年ゼミ)、社会学基礎演習3(2部ゼミ)の合同ゼミ論集を刊行しました。以下は、その目次です(著者情報は省略します)。 メディアコミュニケーシ…

この脅迫状を書いたのは誰か?

来たる6月21日(日)、東洋大学の“学び”LIVEで50分間の公開授業をすることになりました。このイベントは、11学部44学科の教員が1日で約100講座を公開するものです。私は、4限 (14:40-15:30) に、テキストマイニングの授業をすることにしました。 小林雄一郎 …