東京大学大学院総合文化研究科

言語情報科学専攻

Language and Information Sciences, University of Tokyo

東京大学大学院総合文化研究科

言語情報科学専攻

〒153-8902 東京都目黒区駒場3-8-1

TEL: 03-5454-6376

FAX: 03-5454-4329

言語情報解析実験実習II(計量文献学・計算言語学のための数学I(確率))

  • 科目コード(修士): 31M200-0451S
  • 科目コード(博士): 31D200-0451S
  • 開講学期: S1, S2
  • 曜限: 金(Fri)2 [10:25-12:10]
  • 教室: 21KOMCEE K501 18号館 言語情報解析室
  • 単位数: 2.0
  • 担当教員: 川崎 義史

授業の目標・概要

・この授業の目標は,言語データの計量的分析に必要な数理的手法(今学期は確率)の習得です。扱うテーマは,いずれも,より高度な手法の基礎となる重要なものです。具体的には,コインの裏表やサイコロの目の出る確率からはじめて,ベイズの定理を理解した後,最尤法によるナイーブベイズ,対数線形モデル(ロジスティック回帰),線形回帰のパラメータ推定までを扱います。

・計量的手法を初めて学ぶ学生を対象として,基礎的事項から説明します。

・パラメータ推定自体は統計ライブラリを使えば事足りますが,「推定の仕組みが気になる」,「ブラックボックスにしておきたくない」という意欲的な学生の受講を期待しています。

授業のキーワード

  • 一様分布
  • 正規分布
  • シグモイド関数
  • ベルヌーイ分布
  • 二項分布
  • 多項分布
  • ポワソン分布
  • ベイズの定理
  • 尤度
  • 最尤法
  • ラグランジュの未定乗数法
  • 偏微分
  • ナイーブベイズ
  • 対数線形モデル(ロジスティック回帰)
  • 線形回帰

授業計画

1.イントロダクション
2.確率分布1
3.確率分布2
4.ベイズの定理1
5.ベイズの定理2
6.最尤法1
7.最尤法2
8.ナイーブベイズ1
9.ナイーブベイズ2
10.ナイーブベイズ3
11.対数線形モデル1
12.対数線形モデル2
13.線形回帰1
14.線形回帰2
15.まとめ

授業の方法

・講義形式です。
・学習事項の確認として,ほぼ毎週,課題が出ます。

成績評価方法

期末テスト(50%),ほぼ毎週の課題(40%),授業への参加状況等(10%)をもとに総合的に判断します。

教科書

特になし

参考書

・高村大也(2010)『言語処理のための機械学習入門』コロナ社(授業は,概ね,この本に沿って進めますが,必ずしも購入する必要はありません)

・涌井良幸, 涌井貞美(2012)『史上最強図解 これならわかる!ベイズ統計学』ナツメ社(「これならわかる」と思います)

・石村貞夫ら(2010)『入門はじめての統計的推定と最尤法』東京図書(最尤法がどんな手法なのかが直観的に理解できる。例題が豊富)

・平岡和幸, 堀玄(2009)『プログラミングのための確率統計』オーム社(「確率は面積だ」というスローガンのもと,基礎から応用まで説明が懇切丁寧。素朴な疑問もコラムで丁寧に解説されている)

・ラリー・ゴニック(2016)『マンガ 「解析学」超入門 微分積分の本質を理解する 』講談社(ブルーバックス)(マンガ形式で,指数関数・対数関数や微分・積分のエッセンスを学ぶことができる)

・マスオ『高校数学の美しい物語』http://mathtrain.jp(高校数学+αが基礎から応用までコンパクトにまとまったサイト)

履修上の注意

・文系レベルの高校数学の基礎知識(ベクトル,指数・対数関数,微分・積分など)は必要なので,不安がある人は復習しておくことをおすすめします。

・余裕があれば扱いますが,基本的にプログラミングは行いません。