読者です 読者をやめる 読者になる 読者になる

2016年5月に購入した本

以下、順不同です。The Cambridge Handbook of English Corpus Linguistics (Cambridge Handbooks in Language and Linguistics)作者: Douglas Biber,Randi Reppen出版社/メーカー: Cambridge University Press発売日: 2015/06/25メディア: ハードカバーこの…

変数間の相関係数の大きいペアを抽出する

多変量データから相関行列を求め、相関係数の大きいペアを抽出する方法を以下にメモしておきます。*1 分析データは、定番のirisです。 # irisデータからSpeciesの情報を削除 iris2 <- iris[, -5] # 相関行列の作成 x <- cor(iris2) # データ形式の変換 libra…

JEFLL Corpusの使い方

この記事は、日本人中学生・高校生約1万人の自由英作文データを集めたJEFLL Corpusの使い方に関する授業資料です(随時更新)。JEFLLの詳細や利用規定に関しては、リンク先を参照してください。また、検索方法に関しては、各自「ヘルプ」を読んでください。 …

書評『英語コーパスを活用した言語研究』

今月発売の『英語教育』に、ハーンス・リンドクヴィスト『英語コーパスを活用した言語研究』の書評を書かせて頂きました。拝読した感想は紙面に書いたとおりなのですが、書かなかったこととしては、Project Gutenbergで「利用可能なテクストの質は100%保証さ…

2016年度に採択された科研費

本年度は、以下の3つの科研費が採択されました。最初の2つ(基盤B、基盤C)は研究分担者として、残りの1つ(挑戦的萌芽)は連携研究者として参加します。 縦断的コーパスの構築と日本人高校生の英語スピーキング力の発達過程の解明(基盤研究B、研究代表者: …

2016年4月に購入した本・ご恵贈頂いた本

以下の本を購入しました。Official TOEFL iBT® Tests Volume 1, 2nd Edition作者: Educational Testing Service出版社/メーカー: McGraw-Hill Education発売日: 2015/09/07メディア: ペーパーバックこの商品を含むブログを見るOfficial TOEFL iBT® Tests Vol…

メディアコミュニケーション学演習(2016年度)

これは、東洋大学社会学部のゼミ「メディアコミュニケーション学演習I9」のサポートサイトです(随時更新)。詳しい授業内容については、シラバスを参照してください。*1 また、時間の経過によって、リンク切れとなる可能性があることをご了承ください。(最…

人間―機械コミュニケーション論(2016年度)

これは、東洋大学社会学部の講義「人間―機械コミュニケーション論」のサポートサイトです(随時更新)。詳しい授業内容については、シラバスを参照してください。*1 また、時間の経過によって、リンク切れとなる可能性があることをご了承ください。(最終更…

2016年3月に購入した本・ご恵贈頂いた本

以下の本を購入しました。英文校正会社が教える 英語論文のミス100作者: エディテージ,熊沢美穂子出版社/メーカー: ジャパンタイムズ発売日: 2016/02/01メディア: 単行本(ソフトカバー)この商品を含むブログを見る そして、以下の本をご恵贈頂きました。心…

2015年度の総括

今年度は、新しい環境になったこともあって、春と夏は殆ど研究をしていませんでした(反省)。秋頃から研究活動を再開し、現在複数の論文を投稿中です。来年度は、もう少し頑張りたいと思います。 著書 Kyoko Oi, Beverley Horne, Masumi Narita, Yuko Itats…

J-POPの歌詞から見る社会

来たる3月29日(火)、東洋大学の“学び”LIVEで50分間の公開授業をすることになりました。このイベントは、11学部44学科の教員が1日で約100講座を公開するものです。私は、1限 (10:30-11:20) に、歌詞分析の授業をすることにしました。*1 小林雄一郎 (2016). …

TOEFL本まとめ(完全版)

チェックしたTOEFL本のまとめです(自分メモ)。随時更新します。 模試&総合対策 Educational Testing Service (2015). 『Official TOEFL iBT Tests Volume 1 (2nd edition)』 McGraw-Hill Education. Educational Testing Service (2016). 『Official TOEF…

2016年2月に購入した本

以下、順不同です。ETS公認ガイドTOEFL iBT CD‐ROM版作者: Educational Testing Service,林功出版社/メーカー: マグロウヒルエデュケーション発売日: 2015/10メディア: 大型本この商品を含むブログを見る【CD3枚付】TOEFLテスト英単語3800 4訂版 (TOEFL(R)大…

英語教育研究のためのテキスト分析入門

来たる2月18日(木)、名古屋大学で開催されるLET外国語教育基礎研究部会第2回特別セミナーにおいて、「英語教育研究のためのテキスト分析入門」というお話をさせて頂くことになりました。平日開催、しかも直前のご案内ではありますが、ご都合のつく方は、ぜ…

2015年度 言語情報処理論/言語処理論B (Day 3)

以下は、東京外国語大学の集中講義「言語情報処理論/言語処理論B」に関するメモです。 Class 11~12: 日本語の分析 この時間では、RMeCabパッケージを用いて、日本語データの解析を行います。*1 教材としては、主に以下のブログ記事を使います。 RMeCabを使…

2015年度 言語情報処理論/言語処理論B (Day 2)

以下は、東京外国語大学の集中講義「言語情報処理論/言語処理論B」に関するメモです。 Class 6~7: グラフィックス この時間では、主に以下の内容を扱います(テキストの6章)。 高水準作画関数 ヒストグラム 箱ひげ図 円グラフ 棒グラフ 散布図 線グラフ …

2015年度 言語情報処理論/言語処理論B (Day 1)

以下は、東京外国語大学の集中講義「言語情報処理論/言語処理論B」に関するメモです。 Class 1: イントロダクション この授業の目的は、文系学生が卒業研究などで用いるデータ処理技術を習得することです。具体的には、(1) Rによるプログラミングの基礎、(2…

2015年度 合同ゼミ論集

私が担当しているメディアコミュニケーション学演習I9(2年ゼミ)、メディアコミュニケーション学基礎演習7(1年ゼミ)、社会学基礎演習3(2部ゼミ)の合同ゼミ論集を刊行しました。以下は、その目次です(著者情報は省略します)。 メディアコミュニケーシ…

2016年1月に購入した本

以下、順不同です。Academic Vocabulary in Learner Writing: From Extraction to Analysis (Research in Corpus and Discourse)作者: Magali Paquot出版社/メーカー: Continuum発売日: 2012/04/26メディア: ペーパーバックこの商品を含むブログを見るSecond…

外国語教育研究におけるスピーキングとライティングの自動採点・評価

来たる3月19日(土)、早稲田大学CCDL研究所第1回シンポジウム「外国語教育研究におけるスピーキングとライティングの自動採点・評価」が開催されます。主なプログラムは、以下の通りです。皆さまのご来場を心よりお待ち申し上げております(参加申し込みは…

QUALICO 2016から採択通知

来たる2016年8月24〜28日にドイツのトリーアで開催されるInternational Quantitative Linguistics Conference (QUALICO) 2016に採択されました。 Yuichiro Kobayashi, Misaki Amagasa, & Takafumi Suzuki (2016). Investigating the chronological variation…

2015年12月に購入した本

以下、順不同です。J-CATオフィシャルガイド: コンピュータによる自動採点日本語テスト作者: 今井新悟,赤木彌生,中園博美出版社/メーカー: ココ出版発売日: 2012/03/29メディア: 単行本この商品を含むブログを見るJ-CAT Japanese Computerized Adaptive Test…

人文情報学の方法論に基づく歌詞の体系的分析

『人文情報学月報』の第53号に「巻頭言」を書かせて頂きました。基本的には、じんもんこん2015で報告した研究内容に基づいています。 小林雄一郎 (2015). 「人文情報学の方法論に基づく歌詞の体系的分析」 『人文情報学月報』53. Online.

Rによる英文テキスト処理

Rで英語のテキストを分析する方法について、学部の紀要に文章を書きました。主に、(1) Rとパッケージのインストール、(2) データの読み込み、(3) KWICコンコーダンス、(4) コンコーダンスプロット、(5) コロケーションテーブル、(6) ワードリスト、(7) ワー…

2015年11月に購入した本・ご恵贈頂いた本

以下の本を購入しました(順不同)。The Cambridge Handbook of Learner Corpus Research (Cambridge Handbooks in Language and Linguistics)作者: Sylviane Granger,Gaëtanelle Gilquin,Fanny Meunier出版社/メーカー: Cambridge University Press発売日: …

LIF 2016から採択通知

来たる2016年3月10〜12日にトルコのイスタンブールで開催されるLanguage in Focus (LIF) 2016に採択されました。 Mariko Abe & Yuichiro Kobayashi (2016). Grammatical, morphological, and lexical errors between careful and vernacular styles. Languag…

2015年10月に購入した本・ご恵贈頂いた本

以下の本を購入しました(順不同)。Corpora and Discourse Studies: Integrating Discourse and Corpora (Palgrave Advances in Language and Linguistics)作者: Paul Baker,Tony McEnery出版社/メーカー: Palgrave Macmillan発売日: 2015/08/31メディア: …

TOEIC本まとめ(2015年度版)

2015年度に、授業準備もしくは自分の英語学習に使ったTOEIC本のリストです(自分メモ)。随時更新します。 模試 Educational Testing Service (2008). 『TOEICテスト新公式問題集〈Vol.3〉』 国際ビジネスコミュニケーション協会. Educational Testing Servi…

TOEIC本まとめ(学習ログ編2)

この記事は、TOEIC本まとめ(学習ログ編1)の続編です。ここでは、それ後に試してみて、良かった本を記録していきます(随時更新)。言うまでもなく、それぞれの本に関するコメントは、私の主観に基づくものです。それらに対する世間の評判は、リンク先にあ…

じんもんこん 2015から採択通知

来たる12月19〜20日に同志社大学で開催されるじんもんこん 2015に口頭発表で採択されました。 小林雄一郎・天笠美咲・鈴木崇史 (2015). 「語彙指標を用いた流行歌の歌詞の通時的分析」 じんもんこん 2015. 現所属の鈴木崇史先生との共同研究で、1977年から20…

2015年9月に購入した本

以下、順不同です。Register, Genre, and Style (Cambridge Textbooks in Linguistics)作者: Douglas Biber,Susan Conrad出版社/メーカー: Cambridge University Press発売日: 2009/10/29メディア: ペーパーバックこの商品を含むブログを見るDimensions of R…

クラメールのVの信頼区間を計算する

r

以前、頻度差の検定の効果量としてファイ係数とクラメールのVを用いるという記事で、南風原 (2014) に書かれている手順を参考にして、クラメールのVの信頼区間を計算する方法を紹介しました。その後、クラメールのVの信頼区間を計算するための関数が複数存在…

The 19th Joint Workshop on Linguistics and Language Processing

来たる12月11~12日、早稲田大学でThe 19th Joint Workshop on Linguistics and Language Processingが開催されます。そこで私も、口頭発表をさせて頂くことになりました。 Yuichiro Kobayashi (2015). A contrastive rhetoric analysis of metadiscourse ma…

IELTS本まとめ

最近、TOEICの勉強と並行して、IELTSの勉強も始めました(こちらはデフォルトで4 skillsのテストなので、数年がかりの長期戦になる可能性が高いです)。自分の学習ログとして、以下に解いた問題集を記録していきます(随時更新)。それぞれの本に関するコメ…

「通時コーパス」国際シンポジウム

来たる10月4日(日)、国立国語研究所で「通時コーパス」国際シンポジウムが開催されます。私も、同じ大学の岡崎友子先生と一緒に講演枠で発表をさせて頂くことになりました。*1 岡崎友子・小林雄一郎 (2015). 「中古作品における接続表現の統計的分析―指示…

TOEIC本まとめ(学習ログ編1)

最近、複数の理由で、TOEICの勉強をしています。そこで、自分の学習ログとして、これまでに役に立った参考書や模試をメモしておこうと思います(これ以外の本にも手を出しましたが、ここでは、複数回やり込んだ本のみを示します)。言うまでもなく、それぞれ…

2015年8月に購入した本

以下、順不同です。これまで(基本的には)TOEIC関連書を図書館で借りていましたが、手元に置いておきたい本を私費で買い直しました。極めろ!リスニング解答力TOEIC TEST―韓国でシリーズ170万部突破!英語のカリスマ イ・イクフンのStep by Step講座作者: イ…

TOEIC本まとめ(上級編)

最近、図書館や書店でTOEIC本を網羅的にチェックする機会があったので、上級者(目標スコアが800~900点くらい)によさそうな参考書をメモしておきます。なお、(1) 基本中の基本である『公式問題集』、(2) TOEIC本まとめ(初級・中級編)で挙げた本、(3) 990…

TOEIC本まとめ(初級・中級編)

最近、図書館や書店でTOEIC本を網羅的にチェックする機会があったので、初級~中級者(目標スコアが600~730点くらいで、『公式問題集』だけで勉強するのは少ししんどいというレベル)によさそうな参考書をメモしておきます(基本的に、各カテゴリーの上の方…

Second International Symposium on EFL Writing in East Asia

来たる10月31日(土)、東京大学でSecond International Symposium on EFL Writing in East Asiaが開催されます。これは、「第二言語ライティング研究の現代的課題と解決のための将来構想―東アジアからの発信―」という科研プロジェクト(基盤研究B、代表者: …

対散布図を描く

r

Rで対散布図を描く場合、一番簡単な方法は、pairs関数を使うことです。 pairs(iris, col = as.numeric(iris$Species), pch = 16) しかし、pairs関数でもう少し綺麗な図を描くには、やや面倒なカスタマイズが必要です。変数間の相関係数を表示したい場合は、p…

2015年7月に購入した本

以下、順不同です。R for Everyone: Advanced Analytics and Graphics (Addison-Wesley Data & Analytics Series)作者: Jared P. Lander出版社/メーカー: Addison-Wesley Professional発売日: 2013/12/29メディア: ペーパーバックこの商品を含むブログを見る…

Effects of a writing prompt on L2 learners' essays

現在ランカスターで開催されているCorpus Linguistics 2015のアブストラクトが公開されました。我々は、以下のような発表を行いました。*1 Masumi Narita, Mariko Abe, & Yuichiro Kobayashi (2015). Effects of a writing prompt on L2 learners' essays. C…

カイマージによる連続データの離散化

カイマージは、カイ二乗検定を用いて、連続データを離散化するための手法です。*1 具体的には、「属性の離散化方法とクラスの確率は独立である」という帰無仮説に基づき、その仮説が棄却される場合は隣接する区間を統合し、棄却されない場合は統合しないとい…

人文科学とコンピュータシンポジウム 「じんもんこん2015」

dh

来たる12月19〜20日、同志社大学京田辺校地にて、情報処理学会の人文科学とコンピュータシンポジウム 「じんもんこん2015」が開催されます。今年のテーマは、「じんもんこんの新たな役割 〜知の創成を目指す文理融合のこれから〜」です。投稿申込締切は、9月…

マイノリティ合成によるオーバー・サンプリング

今回は、不均衡データの分類に挑戦します。*1 最もシンプルな不均衡データへの対処としては、復元抽出によって、マイナークラスの標本数を増やすことが挙げられます。しかし、同じ標本が複数含まれることによって、過学習を引き起こしやすくなると言われてい…

語彙多様性とリーダビリティを用いたテキスト分析

外国語教育メディア学会中部支部の『外国語教育基礎研究部会2014年度報告論集』に以下の原稿を載せて頂きました。センター試験の英語長文問題を例に、Rによる分析を行いました。本稿のPDFは、こちらで公開されています。*1 小林雄一郎 (2015). 「語彙多様性…

stringrを使った文字列処理 (3)

今回も、stringrパッケージを使った文字列処理を紹介します。まず、str_subset関数を使うと、指定したパターンにマッチする文字列を含む要素が得られます。 # パッケージの読み込み library(stringr) # パターンにマッチする文字列を含む要素を抽出 verbs <-…

stringrを使った文字列処理 (2)

今回も、stringrパッケージを使った文字列処理を紹介します。まず、大文字と小文字の置換を行うには、str_to_upper関数、str_to_lower関数、str_to_title関数が便利です。 # パッケージの読み込み library(stringr) # 大文字と小文字の置換 x <- "R is a fre…

stringrを使った文字列処理 (1)

今回は、stringrパッケージを使った文字列処理を紹介します。まず、str_length関数を使うと、文字列の長さを計算することができます。 # パッケージの読み込み library(stringr) # 文字列の長さ str_length("have") 上記のスクリプトを実行すると、以下のよ…