東京大学大学院総合文化研究科

言語情報科学専攻

Language and Information Sciences, University of Tokyo

東京大学大学院総合文化研究科

言語情報科学専攻

〒153-8902 東京都目黒区駒場3-8-1

TEL: 03-5454-6376

FAX: 03-5454-4329

言語データ分析基礎 (言語学のためのデータ分析と仮説検定)

  • 科目コード: 08C1555
  • 開講学期: A2
  • 曜限: 火曜5限 Tue 5th
  • 教室: 駒場18号館 言語情報解析室
  • 単位数: 1
  • 担当教員: 川崎 義史

授業の目標・概要

・この授業の目標は,データ解析環境Rを用いて,データ分析と仮説検定の手法を習得することです。
・R等のコンピュータ言語,統計処理を初めて学ぶ学生を対象として,基礎的事項から説明します。
・コーパス言語学や心理言語学を例に,実証的研究の全体の流れを掴み,その中でのデータ分析と仮説検定の役割と,それらの基本的な手法を習得します。
・幾つかのデータを実際に自分で処理することを通じて,自分で使えるようになることを目指します。

授業のキーワード

  • データ分析
  • R
  • 統計
  • 仮説検定
  • Data analysis

授業計画

1.イントロダクション
2.データの表現と操作
3. 記述統計と可視化(ヒストグラム,箱ひげ図)
4. 可視化(クロス集計表,モザイクプロット,散布図) 
5. 仮説検定(導入とカイ2乗検定)
6. 仮説検定(t検定と分散分析・F検定)
7. 仮説検定(相関係数と線形回帰)

授業の方法

・講義を中心としつつ,適宜,実習を交えます。
・学習事項の確認として,複数回,課題が出ます。

成績評価方法

期末レポート(70%),課題(20%),授業への参加状況等(10%)をもとに総合的に判断します。

教科書

特になし。プリントを配布する。

参考書

・K.Johnson: Quantitative Methods in Linguistics. Blackwell, 2008, ISBN978-1-4051-4425-4
・R.H.Baayen: Analyzing Linguistic Data. Cambridge, 2008, ISBN978-0-521-70918-7
・S.Th.Gries: Quantitative Corpus Linguistics with R.Routledge, 2009, ISBN0-415-96270-6

履修上の注意

特になし。