日本語や英語など,日常的な言語(自然言語)を工学的な立場から捉え,それらを計算機で処理するための「自然言語処理」について,その概要を学ぶ.計算機処理可能な形式で文の意味を得るための自然言語理解と呼ばれる一連の過程(単語分割,品詞ダグ付け,構文解析,意味解析),テキストのカテゴリ分け(テキスト分類),テキストから必要な情報を取り出す情報抽出を扱う.自然言語処理のツール集であるNLTKを用いて実際の動作を試し,理解を深めるようにする(ただし,NLTKの活用方法やそれを含んだプログラミング技術の習得は本講義の目的ではない).
1 導入,2 単語分割と単語正規化,3, 4 品詞タグ付け,5,6 テキスト分類,7 語の意味の扱い,8 情報抽出とチャンキング,9,10 文脈自由文法と構文解析,11,12 素性に基づく文法,13,14 一階述語論理と構成的意味論, 15 まとめ
主に講義形式で行うが,計算機を用いた実習を含む(プログラミングの知識は前提としない)
隔週程度の課題提出と期末レポートによる
プリントを利用する
Steven Bird, Ewan Klein, and Edward Loper "Natural Language Processing with Python" Oreilly & Associates Inc, ISBN 0596516495(萩原 正人他訳「入門 自然言語処理」 オライリージャパン,ISBN 4873114705 ) その他については開講時に指示する
教室設備の制約(計算機台数)により,受講者数を制限する場合がある