本書は、生成AIを使った動画解析の基礎から実践までを、フルスクラッチで説明した書籍です。読者自ら、Pythonを使って簡単な動画解析プログラムが作成できるよう、生成AIを使った動画解析のしくみから具体的なプログラムのサンプルコードまでを1冊にまとめています。
これまでに収集した未処理の動画データを活用して有用な結果を得たい方、動画解析を使ってこれまでにないサービスを実現したい方におすすめの書籍です。
https://www.ohmsha.co.jp/book/9784274234163/
正誤表やDLデータ等がある場合はこちらに掲載しています
第1章 生成AIとヒューマンセンシング
第2章 人間を対象とした解析
第3章 実行環境の準備と画像解析モデルの基礎
第4章 コンピュータヴィジョン
第5章 パイプライン導入
第6章 ヒューマンセンシングAI
第7章 LLMチュートリアル
第8章 マルチモーダル技術の基礎
第9章 ヒューマンセンシングと生成AIの融合
第1章 生成AIとヒューマンセンシング
1.1 ヒューマンセンシング
1.2 ヒューマンセンシング技術の類型
1.3 深層学習による画像解析とヒューマンセンシング
1.4 デジタルトランスフォーメーション
1.5 ヒューマンセンシングAIの特長
第2章 人間を対象とした解析
2.1 可能性
2.2 注意点
2.3 生成AIとヒューマンセンシング
第3章 実行環境の準備と画像解析モデルの基礎
3.1 画像解析モデルの実行環境
3.2 Pythonの各種ライブラリ
第4章 コンピュータヴィジョン
4.1 画像とは
4.2 画像データの読み込み
4.3 画像データの編集
4.4 動画とは
4.5 動画データの読み込み
4.6 動画データの編集
第5章 パイプライン導入
5.1 パイプライン
5.2 実装例
第6章 ヒューマンセンシングAI
6.1 物体検出
6.2 姿勢推定
6.3 セグメンテーション
6.4 動画への適用
第7章 LLMチュートリアル
7.1 LLMアーキテクチャ
7.2 ファインチューニング
7.3 出力文の生成
7.4 LLM の実装例
第8章 マルチモーダル技術の基礎
8.1 マルチモーダル技術とは
8.2 マルチモーダルモデル
8.3 画像キャプショニングとVQAの実践例
8.4 ゼロショット画像分類
8.5 Grounding DINO
第9章 ヒューマンセンシングと生成AIの融合
9.1 ヒューマンセンシングと生成AIの融合がもたらすインパクト
9.2 具体的な活用例
9.3 生成AIブームが終わった後も