21124113

情報科学INS502b  INS504e 

3年前学期金2

多変量解析

Multivariate Analysis

原田 慧

単位区分

単位数: 2単位
必修
課程・類・プログラム
種別
先端工学基礎課程

関連Webサイト

Google Classroomを利用する。

主題および達成目標

機械学習の種々の手法を、基本的な事項から始めて実装ができることを目標に講義する。
"Introduction to Statistical Learning" のPython版をテキストとし講義を行う。この書籍は現時点で統計的学習および機械学習の入門書として最も推薦できるものである。

前もって履修しておくべき科目

線形代数、総合コミュニケーション科学

前もって履修しておくことが望ましい科目

確率論、統計学
データサイエンス演習を並行履修することを前提に講義を進める

教科書等

<教科書>
Gareth James, Daniela Witten, Trevor Hattie, Robert Tibshirani, and Jonathan Taylor (2023): An Introduction to Statistical Learning with Applications in Python, Springer.
著者らによる下記サイトでpdfを無料ダウンロードできるため、紙媒体の書籍を購入して持ち歩く必要はない。
https://www.statlearning.com

<参考資料>
同サイトで著者による講義スライド(英語版)も公開されている。
国友らによる講義スライドの日本語訳も無料で公開されている。講義はこのスライドをベースに用いる。
http://www.kunitomo-lab.sakura.ne.jp/SSE-DP-2023-3.pdf

おテキストの日本語訳(Rによる統計的学習入門)もあるが、古い版の翻訳で、言語がRで、しかもそれなりに高価であるため、購入は推奨しない。
また、古典的な「多変量解析」のテキストは本講義の範囲をカバーしないので注意すること。
その他の参考書等は各講義で提示する。

授業内容とその進め方

講義はスライド、説明ともに日本語で実施する。
Lectures and slides will be given in Japanese.

1. 導入
2. 線形回帰
3. 分類(ロジスティック回帰)
4. リサンプリング法(モデルの検証)
5. 線形モデル選択と正則化
6. 木に基づく
7. サポートベクターマシン
8. 深層学習(1)
9. 深層学習(2)
10. 統計的学習
11. 生存時間解析と打ち切りデータ
12. 教師なし学習
13. 構造モデリング
14. 多重検定、スプライン法などの補足
15. レポート課題の提示と説明

実務経験を活かした授業内容

担当教員は元実務家である。
実務経験をもとに適宜補足を入れながら講義を行う。

授業時間外の学習

毎回のクイズへの取り組みを通じた復習が必要である。また、期末にレポート試験を課す。

成績評価方法および評価基準

出席(12%)+毎回のクイズ(28%)+レポート(60%)
学期間中および学期末に課すレポート課題に基づいて、授業内容の理解度、および実際の問題への適用の達成度を測る。各分析手法を理解して、適切に適用できることを最低達成基準とする。

オフィスアワー・授業相談

西5号館8階にてコーヒー会を開催するので、その中で質問を受け付ける予定。

学生へのメッセージ

講義時間に説明できることは限られている。しっかりとした予習復習は必須としないが、データ分析を取り入れた卒業研究をしたい等、興味があるならば章末の演習問題を解くなど、積極的に自習してほしい。

その

教科書は英語であるが、この本の英語自体は読みやすい。英語で書かれた文章が読めることは国内企業で働く上でも、やりたい仕事をする上でとても重要なことなので、苦手意識を持たず頑張ってください。

キーワード

Data mining
Machine learning
Python
Statistical learning
データマイニング
機械学習
統計的学習理論
最終変更日時: 2025/03/10 20:21:59