本書は、化学・化学工学分野でPythonを使って機械学習を行うための入門書です。
これまでに蓄積してきた実験/製造データをデータ解析・機械学習を用いて分析することで、いままでとはまったく別のアプローチで材料開発を加速させたり、プロセス管理を効率化・安定化させたりすることができます。なぜなら、実験や製造データは、目に見えない、研究者・技術者の知識・知見・経験・勘の宝庫だからです。そして、データ解析・機械学習を用いることで、これらを目に見える形にすることができるからです。
読者が一から実践できるよう、Pythonのインストール方法、データ解析・機械学習の基本理論から、材料設計、分子設計、プロセス管理について実際にサンプルプログラムとサンプルデータセットを使った実践までを丁寧に解説しています。
https://www.ohmsha.co.jp/book/9784274230929/
正誤表やDLデータ等がある場合はこちらに掲載しています
第1部 Python と統計の基礎知識
第1章 Pythonの基礎
第2章 データの図示
第2部 データ解析・機械学習の基礎
第3章 多変量データとデータの可視化
第4章 化学データを用いたモデリング
第5章 回帰モデル・クラス分類モデルの適用範囲
第3部 化学・化学工学データでの実践のしかた
第6章 材料設計,分子設計,医薬品設計
第7章 時系列データの解析
第8章 Datachemical LABを用いた化学・化学工学のデータ解析・機械学習
第1部 Python と統計の基礎知識
第1章 Pythonの基礎
1.1 Pythonの使い方
1.2 データセットの読み込み・保存
第2章 データの図示
2.1 ヒストグラム
2.2 箱ひげ図
2.3 散布図
2.4 相関行列
第2部 データ解析・機械学習の基礎
第3章 多変量データとデータの可視化
3.1 多変量データ
3.2 データの前処理
3.3 主成分分析(Principal Component Analysis:PCA)
3.4 階層的クラスタリング
3.5 [発展]非線形の可視化手法:t-distributed Stochastic Neighbor Embedding(t-SNE)
第4章 化学データを用いたモデリング
4.1 回帰分析(regression analysis)
4.2 クラス分類(classication)
第5章 回帰モデル・クラス分類モデルの適用範囲
5.1 モデルの適用範囲(Applicability Domain:AD)とは?
5.2 データ密度
5.3 アンサンブル学習法(Ensemble learning)
第3部 化学・化学工学データでの実践のしかた
第6章 材料設計,分子設計,医薬品設計
6.1 材料設計
6.2 分子設計,医薬品設計
6.3 化学構造の表現方法
6.4 化合物群の扱い
6.5 化学構造の数値化
6.6 化学構造の生成
6.7 化合物のデータセットを扱うときの注意点
6.8 具体的なデータセットを用いた解析
第7章 時系列データの解析
7.1 化学プラントにおける推定制御・ソフトセンサー
7.2 時系列データ解析の特徴
7.3 モデルの劣化と適応型ソフトセンサー(Adaptive Soft Sensor)
7.4 データ解析・機械学習による化学プラントのプロセス管理(異常検出,異常診断)
第8章 Datachemical LABを用いた化学・化学工学のデータ解析・機械学習
8.1 Datachemical LAB
8.2 材料設計
8.3 分子設計
8.4 適応型ソフトセンサー
8.5 Datachemical LAB による材料設計・分子設計・プロセス設計・プロセス管理