東京大学大学院総合文化研究科

言語情報科学専攻

Language and Information Sciences, University of Tokyo

東京大学大学院総合文化研究科

言語情報科学専攻

〒153-8902 東京都目黒区駒場3-8-1

TEL: 03-5454-6376

FAX: 03-5454-4329

言語情報処理I[学際言語科学コース](計量文献学・計算言語学入門)

  • 科目コード: 08C1516
  • 開講学期: S1, S2
  • 曜限: 水(Wed)3 [13:00-14:45]
  • 教室: 18号館 言語情報解析室
  • 単位数: 2.0
  • 担当教員: 川崎 義史

授業の目標・概要

・この授業の目標は,言語や文学作品などの文献を計量的・計算的に分析する手法を学ぶことです。

・様々なタイプの研究を,広く浅く(ときに深く)扱います。

授業のキーワード

  • Authorship Attribution
  • 文書分類
  • 多変量解析
  • The Federalist Papers
  • シェークスピア
  • 源氏物語
  • 言語変化
  • Google Ngram Viewer
  • コーパス言語学
  • 計量方言学
  • 言語接触
  • バイリンガリズム
  • ジップの法則
  • 意味の分散表現

授業計画

 

授業の方法

・前半は,講義中心で進めます。
・後半は,担当者に論文の内容を発表してもらいます。

成績評価方法

課題,発表,レポート,授業への貢献度をもとに総合的に判断します。

教科書

特になし

参考書

・エレツ エイデン,ジャン=バティースト ミシェル(2016)『カルチャロミクス 文化をビッグデータで計測する』(阪本芳久 訳)草思社
・金明哲(2009)『テキストデータの統計科学入門』岩波書店
・村上征勝(1994)『真贋の科学 計量文献学入門』朝倉書店
・村上征勝(2002)『文化を計る 文化計量学序説』朝倉書店
・村上征勝(2004)『シェークスピアは誰ですか?計量文献学の世界』文藝春秋
・村上征勝ら(2016)『計量文献学の射程』勉誠出版

・Digital Scholarship in the Humanities (DSH). https://academic.oup.com/dsh (計量文献学・計算言語学のジャーナル)
・Google Ngram Viewer https://books.google.com/ngrams

履修上の注意

文系レベルの高校数学の基礎知識(ベクトル,指数・対数関数,微分・積分など)があることが望ましい。