本書は、アンケートやSNSといったテキストデータを対象とした分析に興味がある方や実務で応用したい方に向けて、テキストアナリティクスに関する基本的な知識と、著者が非常に重要であると考える技術について解説した入門書です。テキストアナリティクスは従来のテキストマイニングにとどまらず、より明確な分析目的や理論的枠組みをもった方法論です。
本書では、データの構築から分析までを行った、汎用性の高い事例を紹介しています。また、単にツールとしてのRの使い方を知るだけでなく、読者が目的に応じた分析方法を判断できるようになるようにまとめています。
サンプルのデータやコードを参考に手を動かしながら学習することができ、初心者の「一冊目」にうってつけです。
https://www.ohmsha.co.jp/book/9784274230639/
正誤表やDLデータ等がある場合はこちらに掲載しています
はじめに
[基礎編]
第1章 テキストアナリティクス入門
第2章 テキストアナリティクスの理論的枠組み
[準備編]
第3章 分析データの準備
第4章 Rの基本
第5章 データ分析の基本
第6章 テキスト分析の基本
[実践編]
第7章 授業評価アンケートの分析
第8章 オンラインレビューを用いたクチコミ分析
第9章 スクレイピングによる特徴語抽出
第10章 警察白書のトピック分析
第11章 文学作品の著者推定
おわりに
参考文献
索引
はじめに
[基礎編]
第1章 テキストアナリティクス入門
1.1 テキストアナリティクスとは
1.2 社会で活用されるテキストアナリティクス
1.3 テキストアナリティクスの活用事例の探し方
1.4 テキストアナリティクスの歴史
第2章 テキストアナリティクスの理論的枠組み
2.1 テキストデータの構築
2.2 テキストデータの分析
[準備編]
第3章 分析データの準備
3.1 データセットの構築
3.2 テキストファイルの作成
3.3 CSVファイルの作成
3.4 テキスト整形
第4章 Rの基本
4.1 Rの導入
4.2 コードの入力
4.3 変数と代入
4.4 ベクトル
4.5 行列とデータフレーム
4.6 ファイルの操作
4.7 パッケージのインストール
4.8 ヘルプの参照
第5章 データ分析の基本
5.1 データハンドリング
5.2 文字列処理
5.3 可視化
5.4 統計処理
第6章 テキスト分析の基本
6.1 RMeCabの導入
6.2 形態素解析
6.3 単語の分析
6.4 n-gramの分析
6.5 共起語の分析
6.6 複数テキストの分析
6.7 頻度表の加工
6.8 用例検索
[実践編]
第7章 授業評価アンケートの分析
7.1 授業評価アンケートに基づく授業改善
7.2 分析データ
7.3 単純な頻度集計
7.4 品詞別の頻度集計
7.5 用例検索
第8章 オンラインレビューを用いたクチコミ分析
8.1 マーケティングのためのクチコミ分析
8.2 分析データ
8.3 レビューの評価と集計
8.4 低評価コメントと高評価コメントの比較
8.5 共起語の集計
8.6 共起ネットワークによる可視化
第9章 スクレイピングによる特徴語抽出
9.1 スクレイピングによるデータ収集
9.2 分析データ
9.3 特徴語抽出
9.4 用例検索
第10章 警察白書のトピック分析
10.1 白書から見る現代社会の諸相
10.2 分析データ
10.3 トピックモデル
10.4 階層型クラスター分析
第11章 文学作品の著者推定
11.1 文体識別指標を用いた著者推定
11.2 分析データ
11.3 箱ひげ図
11.4 対応分析
11.5 ランダムフォレスト
おわりに
参考文献
索引