本書は、テキストマイニングの初心者に向けて活用事例を解説した入門書です。実務ですぐに応用したい人や、すでにほかの分析ツールを使っている方が参考にできる活用事例も豊富に掲載しています。
また、実際のレポートや、データの収集からテキスト整形などの前処理、分析対象とする単語や品詞の頻度集計、分析対象に合わせた統計手法の選定、分析結果の可視化まで、分析プロジェクトにおける一連の流れを省略せずに解説しました。
読者が実際にRによるテキストマイニングの分析ができるように最大限配慮しています。
https://www.ohmsha.co.jp/book/9784274222771/
正誤表やDLデータ等がある場合はこちらに掲載しています
はじめに
Part I Rによるテキストマイニング
第1章 テキストマイニングの活用
第2章 Rの活用
Part II 日本語テキストマイニングの活用事例
第3章 授業評価アンケートの分析
第4章 オンラインレビューを用いたクチコミ分析
第5章 スクレイピングによる特徴語抽出
第6章 Twitterにおける話題と感情の抽出
第7章 警察白書のトピック分析
第8章 文学作品の著者推定
Part III 英語テキストマイニングの活用事例
第9章 政治演説の言語分析
第10章 文学テキストの類型化
おわりに
目次
はじめに
Part I Rによるテキストマイニング
第1章 テキストマイニングの活用
1.1 テキストマイニングが活用される場面
1.2 テキストマイニングで活用されるデータ
1.3 テキストマイニングで活用される解析手法
1.4 テキストマイニングで活用される分析項目
1.5 テキストマイニングの分析レポート作成
第2章 Rの活用
2.1 Rの導入
2.2 基本操作
2.3 データハンドリング
2.4 可視化
2.5 テキスト処理
Part II 日本語テキストマイニングの活用事例
第3章 授業評価アンケートの分析
3.1 授業評価アンケートに基づく授業改善
3.2 分析データ
3.3 単純な頻度集計
3.4 品詞別の頻度集計
3.5 用例検索
第4章 オンラインレビューを用いたクチコミ分析
4.1 マーケティングのためのクチコミ分析
4.2 分析データ
4.3 レビューの評価の集計
4.4 低評価コメントと高評価コメントの比較
4.5 ワードクラウドによる可視化
4.6 共起語の集計
4.7 共起ネットワークによる可視化
第5章 スクレイピングによる特徴語抽出
5.1 スクレイピングによるテキストデータ収集
5.2 分析データ
5.3 特徴語抽出
5.4 用例検索
第6章 Twitterにおける話題と感情の抽出
6.1 ソーシャルデータ解析
6.2 ツイートを収集するための準備
6.3 分析データ
6.4 話題分析
6.5 感情分析
第7章 警察白書のトピック分析
7.1 白書から見る現代社会の諸相
7.2 分析データ
7.3 トピックモデル
7.4 階層型クラスター分析
第8章 文学作品の著者推定
8.1 文体識別指標を用いた著者推定
8.2 分析データ
8.3 箱ひげ図
8.4 教師なし学習
8.5 教師あり学習
Part III 英語テキストマイニングの活用事例
第9章 政治演説の言語分析
9.1 政治家の言語分析
9.2 分析データ
9.3 語彙多様性とリーダビリティ
9.4 高頻出語
9.5 感情分析
第10章 文学テキストの類型化
10.1 多変量解析を用いた文学研究
10.2 分析データ
10.3 高頻出語
10.4 テキスト分類
おわりに