東京大学大学院総合文化研究科

言語情報科学専攻

Language and Information Sciences, University of Tokyo

東京大学大学院総合文化研究科

言語情報科学専攻

〒153-8902 東京都目黒区駒場3-8-1

TEL: 03-5454-6376

FAX: 03-5454-4329

言語情報処理Ⅱ(Pythonによる自然言語処理アルゴリズム入門)

  • 科目コード: 08C1517
  • 開講学期: 冬
  • 曜限: 火曜5限
  • 教室: 18号館言語情報解析室
  • 単位数: 2.0
  • 担当教員: 加藤 恒昭

授業の目標・概要

自然言語に関する文法規則や辞書情報を記述する手法と,それらを用いて文の統語構造(や論理形式)を得るための基本的な仕組みを学ぶ.同時に,それらをコンピュータ・プログラムとして実装するためにプログラミングの基礎を学び,実際に文の統語構造や意味を自動解析するプログラムを作成し,コンピュータを用いて文の分析を行ってみる.プログラミング言語としてはpythonを用いる.プログラミングやプログラミング言語についての予備知識は前提としない.

授業のキーワード

  • 自然言語処理

授業計画

  1. 導入 自然言語処理とは
  2. プログラミングとその環境
  3. データと処理
  4. 入出力と制御構造
  5. 関数と名前空間
  6. 再帰構造
  7. 正規文法の表現と処理
  8. 文法のネットワーク表現
  9. 文脈自由文法とその処理(1)
  10. 文脈自由文法とその処理(1)
  11. 素性構造と単一化(1)
  12. 素性構造と単一化(2)
  13. 文脈自由文法の拡張
  14. 日本語形態素解析
  15. 依存構造解析

授業の方法

講義を中心とするが,授業時間中や課題として実際にコンピュータを操作して,プログラムの動作を確認する.

成績評価方法

ほぼ毎週の課題(簡単なプログラミング)提出と期末レポートによる.

教科書

プリントを利用する

参考書

開講時に指示する

履修上の注意

第1回の授業で,コンピュータ利用のためのアカウント等について説明する