東京大学大学院総合文化研究科
言語情報科学専攻
Language and Information Sciences, University of Tokyo
コンピュータで言語コーパス(電子テクスト)を分析する基本的な技術を身につけるとともに、言語の研究においてコーパス分析が有用であるテーマを設定できるようになることが目標。さまざまなコーパスの紹介と既存・自作プログラム(Perl言語が中心)による分析を行う。
具体的には、webの検索を手始めに、コーパスの取得と作成、既存ソフトと自作ソフトによる分析などを行う。自作ソフトについては、perl言語によって簡単なプログラムを自ら作成できることを目指す。後半は、参加者が何をどうすれば面白い結果が出せるかを発案・発表しながら進めたい。
授業は、18号館1階の言語情報解析室のunix端末を使って行う。実習形式が中心となるが、各回の最初には講義形式も含まれる。
授業中の発表および期末レポートによる(授業では日本語と英語を中心に扱うがレポートでは他の言語を扱うことも可能である)。
特になし。
『コーパス言語研究--Perlに よる言語情報処理の方法と実践』(幸田薫、私家版、授業で配布する)。他の参考書は、この冊子に記載してある。