東京大学大学院総合文化研究科

言語情報科学専攻

Language and Information Sciences, University of Tokyo

東京大学大学院総合文化研究科

言語情報科学専攻

〒153-8902 東京都目黒区駒場3-8-1

TEL: 03-5454-6376

FAX: 03-5454-4329

言語情報解析II(コーパス言語学の言語研究への応用)

  • 科目コード(修士):31M200-0340S
  • 科目コード(博士):31D200-0340S
  • 開講学期: 夏
  • 曜限:火曜5限
  • 教室:18号館 言語情報解析室
  • 単位数: 2.0
  • 担当教員: 幸田 薫

授業の目標・概要

認知意味論、語彙意味論、フレーム意味論などの研究へのコーパス言語学の応用例の文献を紹介、講読し、実際にコンピュータ上で実験してみる。対象言語は、日本語、英語、ドイツ語が中心となる。通年での受講が望ましい。

授業のキーワード

  • コーパス言語学
  • 多義語
  • 共起語
  • 認知意味論
  • 語彙意味論
  • フレーム意味論
  • ワードネット
  • フレームネット
  • 茶筅
  • トゥリー・タガー
  • パール
  • 電子辞書
  • corpus linguistics
  • polysemy
  • collocation
  • cognitive semantics
  • lexical semantics
  • frame semantics
  • WordNet
  • FrameNet
  • chasen
  • tree-tagger
  • perl
  • electronic dictionaries

授業計画

Perl言語を用いた単純な検索・集計から始めて、共起語分析を行ったり、形態素解析ソフト・統語解析ソフト・電子辞書を利用してプレーンテキストからタグ付けされたコーパスを作成し、語の意味と文の意味を調べたりする。参加者は各自の研究テーマに関わる問題を設定して、授業中に学んだ方法を適用した発表をする。その延長線上で期末レポートをまとめる。

授業の方法

文献の講読とコンピュータを使った実習とを交互に行う。授業は、18号館1階の言語情報解析室のunix端末で演習・実習形式で行う。

成績評価方法

授業中への積極的な参加と期末レポートによる。

教科書

特になし

参考書

授業で指示する。

履修上の注意

コンピュータを使うことが嫌いでは履修が難しい。