東京大学大学院総合文化研究科

言語情報科学専攻

Language and Information Sciences, University of Tokyo

東京大学大学院総合文化研究科

言語情報科学専攻

〒153-8902 東京都目黒区駒場3-8-1

TEL: 03-5454-6376

FAX: 03-5454-4329

言語情報処理II[学際言語科学コース] (自然言語処理入門)

  • 科目コード: 08C1517
  • 開講学期: A1A2
  • 曜限: 月曜2限 Mon 2nd
  • 教室: 駒場18号館 言語情報解析室
  • 単位数: 2
  • 担当教員: 加藤 恒昭

授業の目標・概要

日本語や英語など,日常的な言語(自然言語)を工学的な立場から捉え,それらを計算機で処理するための「自然言語処理」について,その概要を学ぶ.計算機処理可能な形式で文の意味を得るための自然言語理解と呼ばれる一連の過程(単語分割,品詞ダグ付け,構文解析,意味解析),テキストのカテゴリ分け(テキスト分類),テキストから必要な情報を取り出す情報抽出を扱う.自然言語処理のツール集であるNLTKを用いて実際の動作を試し,理解を深めるようにする(ただし,NLTKの活用方法やそれを含んだプログラミング技術の習得は本講義の目的ではない).

授業のキーワード

  • 自然言語処理
  • NLTK
  • テキスト処理
  • 計算言語学
  • 開講

授業計画

1 導入,2 単語分割と単語正規化,3, 4 品詞タグ付け,5,6 テキスト分類,7 語の意味の扱い,8 情報抽出とチャンキング,9,10 文脈自由文法と構文解析,11,12 素性に基づく文法,13,14 一階述語論理と構成的意味論, 15 まとめ

授業の方法

主に講義形式で行うが,計算機を用いた実習を含む(プログラミングの知識は前提としない)

成績評価方法

隔週程度の課題提出と期末レポートによる

教科書

プリントを利用する

参考書

Steven Bird, Ewan Klein, and Edward Loper "Natural Language Processing with Python" Oreilly & Associates Inc, ISBN 0596516495(萩原 正人他訳「入門 自然言語処理」 オライリージャパン,ISBN 4873114705 ) その他については開講時に指示する

履修上の注意

教室設備の制約(計算機台数)により,受講者数を制限する場合がある