Rによる多変量解析入門 データ分析の実践と理論

多変量解析手法の理論と実践をバランスよく習得できる!

このような方におすすめ

・ツールによる実践的な記述を望んでいる人
・Rで手軽にデータ解析を行いたい人
・大学のサブテキスト
  • 著者川端一光・岩間徳兼・鈴木雅之 共著
  • 定価3,672 (本体3,400 円+税)
  • A5 448頁 2018/07発行
  • ISBN978-4-274-22236-8
  • 定価
  • ポイント0
  • 数量

※本体価格は変更される場合があります。
※通常2〜3日以内で発送いたします。

  • 概要
  • 主要目次
  • 詳細目次

様々な媒体、経路を通じて大規模データが、驚くほど低コストで入手できるようになった現在、多変量解析手法に習熟したデータサイエンティストに対する学術界、ビジネス界からのニーズは非常に高まっており、これに対して大学や企業では、高いデータ解析力を持った人材の育成に注力し始めています。しかし、多くの多変量解析についての学習書は、理論的な説明に終始し、実務場面でどのように利用されているかについて、殆ど配慮がない野が現状です。

そこで本書は、多変量解析手法の理論と実践をバランスよく解説することで、統計が得意ではない大学生や実務者にも利用しやすい構成とし、本書1冊で多変量解析手法を実務に応用できるまで習得できる内容となっています。

https://www.ohmsha.co.jp/book/9784274222368/
第I部 多変量解析の基礎
第1章 多変量解析の基礎を学びたい―R による多変量データの基本的な統計処理
第2章 R によるデータハンドリングを学びたい ―アンケートデータと ID-POS データのハンドリング

第II部 量的変数の説明・予測
第3章 現象を説明・予測する統計モデルを作りたい (1) ―重回帰分析
第4章 現象を説明・予測する統計モデルを作りたい (2) ―階層的重回帰分析
第5章 さまざまな集団から得られたデータを分析したい―マルチレベルモデル
第6章 複雑な仮説を統計モデルとして表したい (1)―パス解析

第III部 心理尺度の分析
第7章 心理尺度を開発したい (1) ―探索的因子分析
第8章 心理尺度を開発したい (2) ―確認的因子分析
第9章 複雑な仮説を統計モデルとして表したい (2) ―潜在変数を伴うパス解析

第IV部 質的変数の説明・予測
第10章 クロス集計表をもっとていねいに分析したい―対数線形モデル
第11章 カテゴリに所属する確率を説明・予測したい―ロジスティック回帰分析

第V部 個体と変数の分類
第12章 似たもの同士にグループ分けしたい―クラスター分析
第13章 質的変数間の連関を視覚化したい―コレスポンデンス分析

第VI部 多変量解析を使いこなす
第14章 データが持つ情報を視覚化したい―パッケージggplot2による描画
第15章 多変量解析を実践で生かしたい―手法の組み合わせ
第I部 多変量解析の基礎

第1章 多変量解析の基礎を学びたい―R による多変量データの基本的な統計処理
1.1 データと手法の概要
 1.1.1 データの概要
 1.1.2 データの読み込み
 1.1.3 手法の概要
1.2 単変量データの基礎分析
 1.2.1 ヒストグラムの描画
 1.2.2 代表値と散布度
1.3 単変量データの群間比較
 1.3.1 ヒストグラムの描画
 1.3.2 代表値と散布度
 1.3.3 箱ヒゲ図
 1.3.4 t検定
 1.3.5 母平均の信頼区間の描画
1.4 多変量データの基礎分析
 1.4.1 多変量データの集計
 1.4.2 多変量データの群間比較
 1.4.3 データの標準化
1.5 多変量データの関係性の分析
 1.5.1 相関関係の分析
 1.5.2 連関の分析
1.6 基本統計量の数理的成り立ち
1.7 偏相関係数
1.8 順序カテゴリカル変数の相関係数
1.9 効果量
 1.9.1 独立な 2 群の t 検定における効果量
 1.9.2 対応のある t 検定における効果量
 1.9.3 その他の効果量と信頼区間
章末演習

第2章 R によるデータハンドリングを学びたい ―アンケートデータと ID-POS データのハンドリング
2.1 手法の概要
2.2 変数の型
 2.2.1 関数strによるデータ構造の把握
 2.2.2 関数 factor の使いどころ
2.3 観測対象の情報の抽出
2.4 欠損値の処理
2.5 ソート
2.6 マージ
2.7 数値の置き換え
2.8 固定長データのハンドリング
2.9 ID-POS データの読み込み
2.10 ID-POS データにおけるソート
2.11 RFM 分析
2.12 ID-POS データにおけるクロス集計表
2.13 顧客 ID 別に月ごとの購買金額を求める
2.14 顧客 ID 別に商品名を取得する―自作関数を利用する
2.15 顧客 ID ごとに来店間隔の分布を描画・要約する
章末演習

第II部 量的変数の説明・予測

第3章 現象を説明・予測する統計モデルを作りたい (1) ―重回帰分析
3.1 データと手法の概要
 3.1.1 データの概要
 3.1.2 分析の目的と概要
3.2 モデル作成と母数の推定・診断
 3.2.1 モデル作成と母数の推定
 3.2.2 推定結果の診断―多重共線性のチェック
3.3 モデルの評価と解釈
 3.3.1 決定係数によるモデル全体の評価
 3.3.2 切片と偏回帰係数の解釈
 3.3.3 偏回帰係数の信頼区間
 3.3.4 単位の異なる説明変数が混在する場合―標準偏回帰係数の算出
3.4 報告例
3.5 質的変数を含む重回帰分析
 3.5.1 分析例
3.6 AIC と BIC によるモデルの評価
3.7 重回帰分析と母数推定理論
 3.7.1 最小 2 乗法による母数推定の概要
 3.7.2 最尤法による母数推定の概要
3.8 偏回帰係数の解釈
3.9 決定係数とその検定
3.10 切片と偏回帰係数の検定
 3.11 切片と偏回帰係数の信頼区間
 3.12 VIF の理論
章末演習

第4章 現象を説明・予測する統計モデルを作りたい (2) ―階層的重回帰分析
4.1 データと手法の概要
 4.1.1 データの概要
 4.1.2 分析の目的と概要
4.2 階層的重回帰分析
 4.2.1 モデル作成
 4.2.2 階層的重回帰分析の実行
 4.2.3 決定係数の増分に関する検定
 4.2.4 AIC と BIC によるモデル比較
4.3 重回帰分析での交互作用効果の検討
 4.3.1 交互作用効果を検討するためのモデル
 4.3.2 中心化
 4.3.3 交互作用効果の検討
 4.3.4 標準偏回帰係数の算出
4.4 単純傾斜分析
 4.4.1 単純傾斜分析の方法
 4.4.2 単純傾斜分析の実行
 4.4.3 交互作用効果のグラフ化
4.5 報告例
4.6 重回帰分析における変数選択
 4.6.1 変数選択とは
 4.6.2 変数選択の実行
章末演習

第5章 さまざまな集団から得られたデータを分析したい―マルチレベルモデル
5.1 データと手法の概要
 5.1.1 データの概要
 5.1.2 データの構造
 5.1.3 分析の目的
 5.1.4 分析手法の概要
5.2 マルチレベルモデルによる分析
 5.2.1 級内相関係数
 5.2.2 中心化
 5.2.3 ランダム切片モデル
 5.2.4 ランダム傾きモデル
 5.2.5 集団レベルの変数を含むモデル
 5.2.6 クロスレベルの交互作用項を含むモデル
5.3 モデル比較
5.4 報告例
5.5 推定法
5.6 複数のレベルを持つデータの例
章末演習

第6章 複雑な仮説を統計モデルとして表したい (1)―パス解析
6.1 データと手法の概要
 6.1.1 データの概要
 6.1.2 分析の目的
 6.1.3 パス図
6.2 パス解析
6.3 モデルの評価とモデルの修正
 6.3.1 モデルの評価―適合度指標
 6.3.2 モデルの修正―修正指標
6.4 結果の解釈とまとめ方
6.5 パス解析の理論
 6.5.1 パス図のモデル式
 6.5.2 母数の推定
6.6 係数の解釈
 6.6.1 パス係数が意味するもの
 6.6.2 非標準化推定値と標準化推定値
6.7 モデルの適合度
 6.7.1 適合度指標
 6.7.2 同値モデル
章末演習

第III部 心理尺度の分析

第7章 心理尺度を開発したい (1) ―探索的因子分析
7.1 データと手法の概要
 7.1.1 データの概要
 7.1.2 分析の目的と概要
7.2 因子数の決定
 7.2.1 ガットマン基準
 7.2.2 スクリーテスト
 7.2.3 平行分析
7.3 因子負荷の推定
7.4 因子軸の回転
7.5 因子の解釈
7.6 報告例
7.7 信頼性の評価
 7.7.1 α係数
 7.7.2 ω係数
7.8 順序カテゴリカル変数の探索的因子分析と信頼性の評価
 7.8.1 データの概要
 7.8.2 順序カテゴリカル変数を扱った探索的因子分析
 7.8.3 信頼性の評価
7.9 探索的因子分析の理論
 7.9.1 探索的因子分析のモデル
 7.9.2 共通性と独自性
 7.9.3 因子軸の回転
7.10 尺度の信頼性
 7.10.1 古典的テスト理論と信頼性
 7.10.2 信頼性係数の推定
章末演習

第8章 心理尺度を開発したい (2) ―確認的因子分析
8.1 確認的因子分析と本章の概要
8.1.1 探索的因子分析と確認的因子分析
 8.1.2 確認的因子分析の手順と本章の概要
8.2 確認的因子分析
 8.2.1 データの概要
 8.2.2 確認的因子分析の実行
8.3 報告例
8.4 順序カテゴリカル変数を扱った確認的因子分析
 8.4.1 データの概要
 8.4.2 確認的因子分析の実行
8.5 モデルの識別性
 8.5.1 モデルの識別性と等値制約
 8.5.2 モデルの識別性と母数の制約
8.6 不適解の問題
8.7 高次因子分析
 8.7.1 データの概要
 8.7.2 分析の目的
 8.7.3 確認的因子分析の実行
8.8 尺度の妥当性
 8.8.1 妥当性
 8.8.2 妥当性と信頼性の関係
章末演習

第 9 章 複雑な仮説を統計モデルとして表したい (2) ―潜在変数を伴うパス解析
9.1 データと手法の概要
 9.1.1 データの概要
 9.1.2 分析の目的と手法の位置づけ
 9.1.3 データの内容の確認
9.2 モデル表現
 9.2.1 モデルで扱う変数およびそれらの関係
 9.2.2 モデル表現の約束事
 9.2.3 モデル記述
9.3 モデルの推定および評価
 9.3.1 推定値の算出
 9.3.2 モデル適合に関する全体的評価
 9.3.3 適合の悪さの詳細と修正の可能性の追究
9.4 最終モデルの推定結果の確認
 9.4.1 変数から変数への影響の強さの確認
 9.4.2 個人差や測定における誤差の大きさ,相関関係の強さの確認
 9.4.3 内生変数に対する影響や内生変数の説明率の確認
 9.4.4 パス図による変数間の関係の視覚的な確認
9.5 報告例
9.6 モデルの数式表現
 9.6.1 測定方程式と構造方程式
 9.6.2 母数の同定と自由度
9.7 モデルの推定
 9.7.1 共分散の構造化
 9.7.2 最尤法の考え方
 9.7.3 母数の検定と信頼区間
 9.7.4 パス係数の標準化推定値
 9.7.5 非正規データの扱い
9.8 発展的な分析に向けて
 9.8.1 母数の関数として表現される量の定義と推定
 9.8.2 平均や切片をモデルに組み込んだパス解析
 9.8.3 複数の母集団を想定したパス解析
章末演習

第IV部 質的変数の説明・予測

第10章 クロス集計表をもっとていねいに分析したい―対数線形モデル
10.1 データと手法の概要
 10.1.1 データの概要
 10.1.2 分析の概要
10.2 飽和モデルの分析
10.3 独立モデルの分析
10.4 最良モデルの探索
10.5 報告例
10.6 対数線形モデルとポアソン分布
10.7 逸脱度
10.8 モデルの自由度
10.9 逸脱度を用いた尤度比検定
10.10 母数の制約
10.11 母数と期待度数
10.12 期待度数と関連づけた母数の解釈
 10.12.1 切片の解釈
 10.12.2 主効果の解釈
 10.12.3 1次の交互作用効果の解釈
 10.12.4 1次の交互作用効果の別の求め方
 10.12.5 2次の交互作用効果の解釈
 10.12.6より高次の交互作用効果
10.13 基準セルの設定
章末演習

第11章 カテゴリに所属する確率を説明・予測したい―ロジスティック回帰分析
11.1 データと手法の概要
 11.1.1 データの概要
 11.1.2 分析の目的
 11.1.3 ロジスティック回帰分析の概要とデータの整形
11.2 係数・切片の推定と解釈
 11.2.1 係数・切片の出力と解釈
 11.2.2 係数・切片の指数変換値の算出と解釈
 11.2.3 係数・切片に関する信頼区間の算出
 11.2.4 標準化係数の算出と解釈
11.3 モデルの良さの評価
 11.3.1 当てはまりの良さの評価指標の出力と解釈
 11.3.2 予測の良さの評価指標の出力と解釈
11.4 その他の有益な指標
 11.4.1 説明変数群の有効性の確認
 11.4.2 変数選択
 11.4.3 多重共線性の確認
11.5 報告例
11.6 モデルの意味
 11.6.1 ロジスティック回帰モデルとは
 11.6.2 切片と係数の指数変換
11.7 母数の推定の考え方
 11.7.1 ベルヌーイ分布と2項分布
 11.7.2 ロジスティック回帰分析における尤度関数
11.8 Hosmer-Lemeshowの適合度検定
11.9 AICとBIC
 11.9.1 モデル逸脱度とヌル逸脱度
 11.9.2 AICとBICの表現
 11.9.3 説明変数群の有効性評価のための検定統計量
章末演習

第V部 個体と変数の分類

第12章 似たもの同士にグループ分けしたい―クラスター分析
12.1 データと手法の概要
 12.1.1 データの概要
 12.1.2 分析の目的と概要
 12.1.3 データの読み込みと確認
12.2 階層的クラスター分析の実行
 12.2.1 クラスター形成の実行
 12.2.2 デンドログラムの見方
 12.2.3 解釈のためのクラスター数の決定と妥当性の評価
 12.2.4 各クラスターの特徴の把握
 12.2.5 z得点化データによる分析
12.3 非階層的クラスター分析の実行―k平均法
 12.3.1 クラスター形成の実行
 12.3.2 クラスター数の妥当性の確認
 12.3.3 z得点化データによる分析
12.4 報告例
12.5 非類似度の考え方
 12.5.1 ユークリッド距離と平方ユークリッド距離
 12.5.2 その他の距離
12.6 階層的クラスター分析におけるクラスター形成の考え方
 12.6.1 ウォード法
 12.6.2 その他の方法
 12.6.3 解釈を困難にするデンドログラムの形状
12.7 非階層的クラスター分析の考え方
 12.7.1 k平均法の概要
 12.7.2 初期クラスター中心の決定
 12.7.3 所属クラスターの更新
12.8 クラスター数の妥当性の確認
 12.8.1 クラスター内とクラスター間での比較の考え方
 12.8.2 3つの指標
章末演習

第 13 章 質的変数間の連関を視覚化したい―コレスポンデンス分析
13.1 データと手法の概要
 13.1.1 データの概要
 13.1.2 分析の目的と概要
13.2 コレスポンデンス分析
 13.2.1 手法の選択と次元の確認
13.3 報告例
13.4 クラスター分析の併用
13.5 多重コレスポンデンス分析
 13.5.1 手法の選択と次元の確認
 13.5.2 図の出力
 13.5.3 さまざまなデータ形式からの多重コレスポンデンス分析の実行
13.6 コレスポンデンス分析の理論
 13.6.1 行プロファイルと列プロファイル
 13.6.2 ユークリッド距離
 13.6.3 行・列スコアの算出
13.7 寄与率・平方相関・慣性
 13.7.1 軸への寄与率
 13.7.2 平方相関
 13.7.3 慣性
章末演習

第VI部 多変量解析を使いこなす

第14章 データが持つ情報を視覚化したい―パッケージggplot2による描画
14.1 データと手法の概要
 14.1.1 データの概要
 14.1.2 分析の目的と概要
 14.1.3 データの読み込み・確認とカテゴリカル変数の水準の設定
14.2 分布の検討
 14.2.1 質的変数における棒グラフ
 14.2.2 量的変数におけるヒストグラム
14.3 時系列変化の検討
 14.3.1 度数を用いる折れ線グラフの描画
 14.3.2 平均を用いる折れ線グラフの描画
14.4 2つの事柄の関係の検討
 14.4.1 パイプ演算子を利用したデータ整形
 14.4.2 散布図の描画
14.5 軸以外の審美的属性のマッピング
 14.5.1 棒グラフにおける塗りつぶし色のマッピング
 14.5.2 折れ線グラフにおける線の色および線種のマッピング
 14.5.3 散布図における点の色および種類のマッピング
14.6 軸と凡例の設定
 14.6.1 軸の設定
 14.6.2 スケールと凡例の設定
14.7 状況・目的に応じたさまざまな図の描画
 14.7.1 集計データからの描画
 14.7.2 他の幾何学的オブジェクトの紹介
章末演習

第15章 多変量解析を実践で生かしたい―手法の組み合わせ
15.1 グループ化―グループの影響の検討
 15.1.1 データの概要
 15.1.2 分析の目的と用いる手法
 15.1.3 データの内容の確認
 15.1.4 グループ化
 15.1.5 グループの影響の検討
15.2 尺度得点化―尺度得点による説明
 15.2.1 データの概要
 15.2.2 分析の目的と用いる手法
 15.2.3 データの内容の確認
 15.2.4 尺度得点化
 15.2.5 尺度得点を用いた説明
15.3 測定状況の確認―多変数間の関係の検討
 15.3.1 データの概要
 15.3.2 分析の目的と用いる手法
 15.3.3 データの内容の確認
 15.3.4 尺度の測定状況の確認
 15.3.5 多変数間の関係の検討

章末演習の解答
参考文献
索引