東京大学大学院総合文化研究科
言語情報科学専攻
Language and Information Sciences, University of Tokyo
単語の頻度調査やコンコーダンス作成等のテキスト処理や,文の統語構造の解析を例に,プログラミングの基礎を学ぶ.初心者を対象に,プログラミングとは何かからはじめて,プログラミングの基本概念を学び,実際にプログラミングをすることで理解を深める.既存の形態素解析ツール(mecab)や依存構造解析ツール(cabocha)やいくつかのライブラリを使って,日本語文書の簡単な分析ができることを目標とする.プログラミング言語はpythonを利用する.
1. 導入 プログラミングとその環境 2-5. プログラミングの基礎(データ構造と制御) 6,7. 頻度表とコンコーダンスの作成 8,9. 文字列処理とオブジェクト 10-12. 形態素解析結果と依存構造解析結果の処理 13. 再帰構造と探索的プログラム 14-15.テキストマイニング
講義を中心とするが,授業時間中や課題として実際にコンピュータを操作して,プログラムの動作を確認する.
隔週程度の課題(簡単なプログラミング)提出と期末レポートによる.
プリントを使用する
開講時に指示する
第1回の授業で,コンピュータ利用のためのアカウント等について説明する.プログラムの経験のない(あるは,ほとんどない)初心者を対象とした内容であり,既に一定のスキルを身につけている学生が受講しても得るものは少ないので,注意すること.