東京大学大学院総合文化研究科

言語情報科学専攻

Language and Information Sciences, University of Tokyo

東京大学大学院総合文化研究科

言語情報科学専攻

〒153-8902 東京都目黒区駒場3-8-1

TEL: 03-5454-6376

FAX: 03-5454-4329

言語情報解析実験実習I (テキストデータの統計処理)

  • 科目コード(修士): 31M200-0440S
  • 科目コード(博士): 31D200-0440S
  • 開講学期: 夏
  • 曜限: 水曜5限
  • 単位数: 2.0
  • 担当教員: 加藤 恒昭

授業の目標・概要

データ解析環境Rを用いて,テキストデータの統計処理を学んでいく.実際にRを使って,単語頻度や単語共起等,テキストデータに関する基本的な統計処理を試していき,自分で使えるようになることを目指す.R等のコンピュータ言語,コーパス言語学,統計処理等についての知識は前提としない.

授業のキーワード

  • データ解析
  • 統計処理
  • テキスト処理
  • コーパス分析

授業の方法

18号館情報解析室にて実習を交えて行う.

成績評価方法

隔週程度に課す課題の提出と学期末レポートによる

教科書

開講時に指示する.

参考書

  • S.Th.Gries: Quantitative Corpus Linguistics with R
    • Routledge, 2009, ISBN0-415-96270-6
  • K.Johnson: Quantitative Methods in Linguistics
    • Blackwell, 2008, ISBN978-1-4051-4425-4