本書は、「テキストマイニングに必要な知識とはなんだろう?」という素朴な疑問に直球でお答えする入門書です。テキストマイニング自体に注力して、わかりやすく解説しています。
単なるツールの説明にならないように、言語学や社会調査法の理論についても前半でていねいにふれ、さまざまな用途に応じたデータの視覚化手法を盛り込みます。また、テキスト分析やデータ分析のためのファイルの作り方についても詳しく説明します。
https://www.ohmsha.co.jp/book/9784274220234/
正誤表やDLデータ等がある場合はこちらに掲載しています
Part I 基礎編
第1章 テキストマイニング入門
第2章 テキストマイニングの理論的枠組み
Part II 準備編
第3章 分析データの準備
第4章 データ分析の基本
第5章 データの可視化.
Part III 実践編
第6章 基本的なテキスト分析
第7章 発展的なテキスト分析
第8章 基本的な統計処理
第9章 発展的な統計処理
第10章 英語テキストの分析
はじめに
Part I 基礎編
第1章 テキストマイニング入門
1.1 テキストマイニングとは
1.2 社会で活用されるテキストマイニング
1.3 テキストマイニングの歴史
第2章 テキストマイニングの理論的枠組み
2.1 テキストデータの構築
2.2 テキストデータの分析
Part II 準備編
第3章 分析データの準備
3.1 データセットの構築
3.2 テキストファイルの作成.
3.3 CSVファイル
3.4 テキスト整形.
第4章 データ分析の基本
4.1 R のインストールと基本操作
4.2 ベクトルと行列
4.3 データの要約..
4.4 文字列処理.
4.5 ファイルの読み込み
第5章 データの視覚化
5.1 ヒストグラム
5.2 箱ひげ図
5.3 モザイクプロット
5.4 散布図
Part III 実践編
第6章 基本的なテキスト分析
6.1 形態素解析
6.2 単語の頻度分析
6.3 n-gramの頻度分析
6.4 共起語の頻度分析
第7章 発展的なテキスト分析
7.1 複数データの頻度解析.
7.2 頻度の標準化と重み付け
第8章 基本的な統計処理
8.1 検定と効果量.
8.2 相関と回帰
第9章 発展的な統計処理
9.1 テキストのグループ化
9.2 テキストの分類.
第10章 英語テキストの分析
10.1 用例検索.
10.2 単語とn-gramの頻度分析
10.3 共起語の頻度分析
10.4 語彙多様性とリーダビリティの分析
おわりに
参考文献