東京大学大学院総合文化研究科

言語情報科学専攻

Language and Information Sciences, University of Tokyo

東京大学大学院総合文化研究科

言語情報科学専攻

〒153-8902 東京都目黒区駒場3-8-1

TEL: 03-5454-6376

FAX: 03-5454-4329

言語データ分析入門(テキストデータの分析と統計処理)

  • 科目コード:08C1505
  • 開講学期: 夏
  • 曜限:火曜5限
  • 教室:18号館 言語情報解析室
  • 単位数: 2.0
  • 担当教員: 加藤 恒昭

講義題目

テキストデータの分析と統計処理

授業の目標・概要

データ解析環境Rを用いて,テキストデータの分析と統計処理を学んでいく.実際にRを使って,単語頻度や単語共起等,テキストデータに関する基本的な分析を行い,それに対する簡単な統計処理を施していく.分析と処理の全体の流れを理解し,自分で使えるようになることを目指す.R等のコンピュータ言語,コーパス言語学,統計処理等についての知識は前提としない.

授業のキーワード

  • データ解析
  • 統計処理
  • テキスト処理
  • コーパス分析

授業の方法

18号館情報解析室にて実習を交えて行う.

成績評価方法

隔週程度に課す課題の提出と学期末レポートによる

教科書

開講時に指示する.

参考書

S.Th.Gries: Quantitative Corpus Linguistics with R
Routledge, 2009, ISBN0-415-96270-6
K.Johnson: Quantitative Methods in Linguistics
Blackwell, 2008, ISBN978-1-4051-4425-4