東京大学大学院総合文化研究科

言語情報科学専攻

Language and Information Sciences, University of Tokyo

東京大学大学院総合文化研究科

言語情報科学専攻

〒153-8902 東京都目黒区駒場3-8-1

TEL: 03-5454-6376

FAX: 03-5454-4329

言語情報解析実験実習I(統計的自然言語処理の基礎を学ぶ)

  • 科目コード(修士): 31M200-0440S
  • 科目コード(博士): 31D200-0440S
  • 開講学期: S1, S2
  • 曜限: 火(Tue)3 [13:00-14:45]
  • 教室: 21KOMCEE K112
  • 単位数: 2.0
  • 担当教員: 加藤 恒昭

授業の目標・概要

統計的自然言語処理の古典的教科書である"Foundations of statistical natural language processing"に沿って,自然言語処理における統計的手法とその応用を学んでいく.

授業のキーワード

  • 自然言語処理 統計 コーパス 

授業計画

1.導入 2.共起 3.n-グラムモデル 4.語義の曖昧性解消 5.語彙獲得 6.マルコフモデル 7.品詞タグ付け 8.確率文脈自由文法 9.確率的構文解析 10.機械翻訳 11.クラスタリング 12.情報検索 13. 文書分類

授業の方法

各回,担当を決め,重要箇所について発表してもらう.それを補う形での講義と並行して行う.

成績評価方法

担当分の発表および授業での貢献,2回に1回程度の小課題による

教科書

[日本語用]
自然言語処理 統計 コーパス 

参考書

C.D. Manning and H. Schuütze "Foundations of statistical natural language processing" The MIT Press, ISBN 0-262-13360-1

履修上の注意