東京大学大学院総合文化研究科
言語情報科学専攻
Language and Information Sciences, University of Tokyo
データ解析環境Rを用いて,データ分析と仮説検定について学んでいく.コーパス言語学や心理言語学を例に,実証的研究の全体の流れを掴み,その中でのデータ分析と仮説検定の役割と,それらの基本的な手法を理解する.幾つかのデータを実際に自分で処理することを通じて,自分で使えるようになることを目指す.R等のコンピュータ言語,統計処理についての知識は前提としない.
第1回 導入
第2回 データの表現と操作
第3回 記述統計と可視化(ヒストグラム,箱ひげ図)
第4回 可視化(クロス集計表,モザイクプロット,散布図)
第5回 仮説検定(導入とカイ2乗検定)
第6回 仮説検定(t検定と分散分析・F検定)
第7回 仮説検定(相関係数と線形回帰)
講義を主とするが,18号館情報解析室にて実習を交えて行う.
隔週程度に課す小課題の提出と学期末レポートによる
利用しない.プリントを配布する
K.Johnson: Quantitative Methods in Linguistics
Blackwell, 2008, ISBN978-1-4051-4425-4
R.H.Baayen: Analyzing Linguistic Data
Cambridge, 2008, ISBN978-0-521-70918-7
S.Th.Gries: Quantitative Corpus Linguistics with R
Routledge, 2009, ISBN0-415-96270-6