本書は,本当にPythonでデータマイニングと機械学習を行いたい人のための入門書です.
初歩からていねいに解説してあります.
本書を読み切れば,誰でもPythonによるデータマイニングと機械学習の主な手法の実装方法が身に付きます。
https://www.ohmsha.co.jp/book/9784274224126/
正誤表やDLデータ等がある場合はこちらに掲載しています
準備編
第1章 データマイニングと機械学習
第2章 Python速習(基本編)
第3章 Python 速習(応用編)
基礎編
第4章 回帰分析
第5章 階層型クラスタリング
第6章 非階層型クラスタリング
第7章 単純ベイズ法による分類
第8章 サポートベクトルマシン法による分類
実践編
第9章 時系列数値データの予測
第10章 日経平均株価の予測
第11章 テキストデータマイニング
第12章 Wikipedia記事の類似度
第13章 画像データの取り扱い手法
第14章 画像の類似判別とクラスタリング
準備編
第1章 データマイニングと機械学習
1.1 ビッグデータ
1.2 データマイニング
1.3 機械学習
1.4 プログラム開発環境の構築
第2章 Python速習(基本編)
2.1 Pythonの基本事項
2.2 Pythonの制御文(分岐)
2.3 Python の制御文(繰り返し)
2.4 リスト
2.5 ディクショナリ
2.6 ファイル入出力
第3章 Python 速習(応用編)
3.1 関数
3.2 クラス
3.3 モジュールとライブラリ
3.4 数値計算ライブラリNumPyと科学計算ライブラリSciPy
3.5 グラフ作成ライブラリmatplotlib
3.6 機械学習ライブラリscikit-learn
3.7 データ分析ライブラリpandas
基礎編
第4章 回帰分析
4.1 モデル、学習と予測
4.2 線形回帰
4.3 評価指標
4.4 scikit-learnによる線形回帰の実現
4.5 重回帰のプログラム例
4.6 リッジ回帰
4.7 scikit-learnによるリッジ回帰の実現
4.8 リッジ回帰のプログラム例
第5章 階層型クラスタリング
5.1 クラスタリング
5.2 階層型クラスタリングと非階層型クラスタリング
5.3 階層型クラスタリングのアルゴリズム
5.4 SciPyによる階層型クラスタリングの実現
5.5 階層型クラスタリングのプログラム例
第6章 非階層型クラスタリング
6.1 k-平均法
6.2 scikit-learnによるk-平均法のプログラム実現
6.3 非階層型クラスタリングのプログラム例
第7章 単純ベイズ法による分類
7.1 分類問題
7.2 正解付きデータセット、そして訓練データとテストデータ
7.3 分類器の評価と評価指標
7.4 単純ベイズ法
7.5 scikit-learnによる単純ベイズ法のプログラム実現
7.6 単純ベイズ法のプログラム例
第8章 サポートベクトルマシン法による分類
8.1 基本的な考え方
8.2 2クラス線形分離問題のサポートベクトルマシン法のモデル
8.3 サポートベクトルマシン法のモデルの最適解
8.4 カーネル法による非線形サポートベクトルマシンモデル
8.5 scikit-learnによるサポートベクトルマシン法のプログラム実現
8.6 サポートベクトルマシン法のプログラム例
実践編
第9章 時系列数値データの予測
9.1 時系列数値データ
9.2 相関係数
9.3 時系列数値データの予測と評価指標
9.4 線形回帰モデルによる時系列数値データの予測
9.5 Pythonによるプログラム実現
9.6 時系列数値データの予測のプログラム例
第10章 日経平均株価の予測
10.1 データの準備と確認
10.2 予測手法の詳細
10.3 説明変数の選択
10.4 日経平均株価(終値)の予測プログラム
第11章 テキストデータマイニング
11.1 形態素解析とMeCab
11.2 MeCabの簡単なプログラム例
11.3 文書データの数値化:TF?IDF
11.4 ベクトル空間モデルとコサイン類似度
11.5 scikit-learnによるプログラム実現
11.6 PythonによるTF-IDFとコサイン類似度のプログラム例
第12章 Wikipedia記事の類似度
12.1 データの準備
12.2 Wikipedia記事から特徴量TF?IDFを抽出する
12.3 Wikipedia記事間の類似度
第13章 画像データの取り扱い手法
13.1 簡単な例:手書き数字の認識
13.2 OpenCVを始めよう
13.3 画像の表現と特徴量
13.4 OpenCVによる特徴量の抽出と画像マッチング
13.5 Pythonによるプログラム例
第14章 画像の類似判別とクラスタリング
14.1 画像類似判別問題
14.2 一致する特徴点を数える手法
14.3 一致する特徴点間の平均距離を用いる手法
14.4 ベクトル量子化
14.5 ベクトル量子化とコサイン類似度を用いる手法
14.6 画像集合のクラスタリング