東京大学大学院総合文化研究科

言語情報科学専攻

Language and Information Sciences, University of Tokyo

東京大学大学院総合文化研究科

言語情報科学専攻

〒153-8902 東京都目黒区駒場3-8-1

TEL: 03-5454-6376

FAX: 03-5454-4329

言語情報処理I[学際言語科学コース] (Pythonによるプログラミングとテキストマイニング入門)

  • 科目コード: 08C1516
  • 開講学期: S1S2
  • 曜限: 水曜5限 Wed 5th
  • 教室: 駒場18号館 言語情報解析室
  • 単位数: 2
  • 担当教員: 川崎 義史

授業の目標・概要

・プログラミング初修者を対象に,Pythonによるプログラミングの基礎を学びます。 ・日本語や英語の単語の頻度カウント,置換・検索,正規表現,品詞タグ付けなどのテキストマイニングの基礎的な手法を学びます。

授業のキーワード

授業計画

1.イントロダクション
2.プログラミング入門(データ型,制御文,関数,データ構造,プロット,クラス)
3.プログラミング入門(データ型,制御文,関数,データ構造,プロット,クラス)
4.プログラミング入門(データ型,制御文,関数,データ構造,プロット,クラス)
5.プログラミング入門(データ型,制御文,関数,データ構造,プロット,クラス)
6.プログラミング入門(データ型,制御文,関数,データ構造,プロット,クラス)
7.プログラミング入門(データ型,制御文,関数,データ構造,プロット,クラス)
8.プログラミング入門(データ型,制御文,関数,データ構造,プロット,クラス)
9.テキストマイニング(頻度カウント,置換
・検索,正規表現,品詞タグ付け)
10.テキストマイニング(頻度カウント,置換
・検索,正規表現,品詞タグ付け)
11.テキストマイニング(頻度カウント,置換
・検索,正規表現,品詞タグ付け)
12.テキストマイニング(頻度カウント,置換
・検索,正規表現,品詞タグ付け)
13.テキストマイニング(頻度カウント,置換
・検索,正規表現,品詞タグ付け)

授業の方法

・講義を中心としつつ,適宜,実習を交えます。 ・学習事項の確認として,複数回,課題が出ます。

成績評価方法

・期末レポート,課題,授業への参加状況等をもとに総合的に判断します。

教科書


・山内 長承.(2017).『Pythonによるテキストマイニング入門』.オーム社.

参考書


・山内 長承.(2017).『Pythonによるテキストマイニング入門』.オーム社.

履修上の注意

・Pythonの既習者には退屈な内容だと思います。 ・教科書後半の機械学習の話は扱いません。