アメリカをはじめ、ヨーロッパや中国などを中心にAI(機械学習)やディープラーニングを活用としたユースケースやビジネスモデルなどが大きく進化し、日本国内においても、自動車、製造、建築・土木、公的機関、eコマースなどさまざまな業種で機械学習やディープラーニングの適用が進んできています。
このようにAIに使われる機械学習を、高い精度・確率のものとするためには、高い品質、さまざまな条件の分布、バリエーションに富んだトレーニングデータを準備することが成功の鍵といえます。 本書では、トレーニングデータの性質に焦点をあて、解説を行います。
https://www.ohmsha.co.jp/book/9784274230448/
正誤表やDLデータ等がある場合はこちらに掲載しています
はじめに
第1章 機械学習とトレーニングデータ
1.1 ディープラーニングに進化する過程
1.2 ディープラーニングはブラックボックス
1.3 機械学習の種類
1.4 プログラミングから見た機械学習
1.5 トレーニングデータの位置付け
第2章 マネジメント層とエンジニアの機械学習
2.1 データ活用とは
2.2 DXからデジタルファーストへ
2.3 マネジメント層の大事な役割
2.4 エンジニアとトレーニングデータ
2.5 機械学習を取り巻く課題
2.6 実行すべきこと
第3章 AIとトレーニングデータ
3.1 音声認識とは
3.2 機械翻訳
3.3 画像認識
3.4 動画
3.5 チャットボット・ボイスボット
3.6 自然言語処理系AI
3.7 固有表現抽出
3.8 ポイントオブインタレスト(POI)
3.9 自動車関連系AI
3.10 AR/VR/MRとメタバース
3.11 その他
第4章 各種トレーニングデータ
4.1 音声データ
4.2 画像データ
4.3 動画データ
4.4 センシングデータ(3D点群データ)
4.5 シンセティックデータ
第5章 データアノテーション
5.1 データアノテーションとは?
5.2 プリラベリングデータ
5.3 音声データからのアノテーション
5.4 テキストデータのアノテーション
5.5 画像データのアノテーション
5.6 アノテーションフォーマット
第6章 アノテーションツール
6.1 アノテーションツールの種類
6.2 データ収集
6.3 プロジェクト定義
6.4 データ管理と割り当て
6.5 音声系へのアノテーション
6.6 テキスト系のアノテーション
6.7 画像・動画系データ
6.8 品質チェック工程
6.9 データ取りまとめ
第7章 データセキュリティ
7.1 関連する法律
7.2 データセキュリティについて
7.3 AI倫理
第8章 トレーニングデータの重要性
おわりに
参考文献