東京大学大学院総合文化研究科

言語情報科学専攻

Language and Information Sciences, University of Tokyo

東京大学大学院総合文化研究科

言語情報科学専攻

〒153-8902 東京都目黒区駒場3-8-1

TEL: 03-5454-6376

FAX: 03-5454-4329

言語データ分析基礎(言語学のためのデータ分析と仮説検定)

  • 科目コード: 08C1555
  • 開講学期: A2
  • 曜限: 月(Mon)3 [13:00-14:45]
  • 教室: 18号館 言語情報解析室
  • 単位数: 1.0
  • 担当教員: 加藤 恒昭

授業の目標・概要

データ解析環境Rを用いて,データ分析と仮説検定について学んでいく.コーパス言語学や心理言語学を例に,実証的研究の全体の流れを掴み,その中でのデータ分析と仮説検定の役割と,それらの基本的な手法を理解する.幾つかのデータを実際に自分で処理することを通じて,自分で使えるようになることを目指す.R等のコンピュータ言語,統計処理についての知識は前提としない.

授業のキーワード

  • データ分析
  • 仮説検定
  • 統計
  • R

授業計画

第1回 導入
第2回 データの表現と操作
第3回 記述統計と可視化(ヒストグラム,箱ひげ図) 
第4回 可視化(クロス集計表,モザイクプロット,散布図) 
第5回 仮説検定(導入とカイ2乗検定)
第6回 仮説検定(t検定と分散分析・F検定)
第7回 仮説検定(相関係数と線形回帰) 

授業の方法

講義を主とするが,18号館情報解析室にて実習を交えて行う.

成績評価方法

隔週程度に課す小課題の提出と学期末レポートによる

教科書

利用しない.プリントを配布する

参考書

K.Johnson: Quantitative Methods in Linguistics
Blackwell, 2008, ISBN978-1-4051-4425-4
R.H.Baayen: Analyzing Linguistic Data
Cambridge, 2008, ISBN978-0-521-70918-7
S.Th.Gries: Quantitative Corpus Linguistics with R
Routledge, 2009, ISBN0-415-96270-6

履修上の注意