国際的なEBM (Evidence-Based Medicine) の潮流をうけ、各医学雑誌は研究の再現性について非常に厳しい目で論文を審査するようになってきました。そのため、正しい統計リテラシーに基づき精確なデータ分析や統計解析を行うこと、また、その結果をわかりやすく可視化し表現することは、臨床医・研究者にとって不可欠といえます。
本書は、統計学の基本事項を学んだ方が実践的な統計解析を行うための橋渡しとなるような内容で構成しました。統計解析のツールとして、プログラミング言語Rとその統合環境RStudioを採用し、Rの導入のハードルが低くなるよう配慮しています。また、事例ごとに、データ分析や統計解析の手法と考え方、Rの記述、分析・解析結果の表現をその都度解説し、統計解析の考え方と関連するRのスキルをまとめて、手を動かしながら実践的に身につけることができる流れとしました。
https://www.ohmsha.co.jp/book/9784274230905/
正誤表やDLデータ等がある場合はこちらに掲載しています
1章 RとRStudioの準備や基本操作
2章 データの読み込みと前処理
3章 変数の種類と記述統計
4章 統計的仮説検定
5章 回帰モデル
6章 多変量回帰モデル
7章 結果のアウトプット
付録
参考文献
1章 RとRStudioの準備や基本操作
1.1. RとRStudioの準備
1.1.1. Rのインストール
1.1.2. RStudioのインストール
1.2. RStudioの基本的な操作方法
1.2.1. RStudioの画面構成
1.2.2. RStudioプロジェクトの新規作成
1.2.3. RStudioでRをはじめよう
1.3. Rの基本動作
1.3.1. 演算結果をオブジェクトに代入する
1.3.2. 関数で演算を行う
1.3.3. RStudioで作成したRファイルを保存する
2章 データの読み込みと前処理
2.1. データファイルの読み込み
2.1.1. 練習用データファイル
2.1.2. データファイルの拡張子
2.1.3. CSVファイルの読み込み(基本編)
2.1.4. CSVファイルの読み込み(応用編)
2.1.5. Excelファイルの読み込みと外部パッケージ
2.2. データフレームの取扱い
2.2.1. データフレームの構造
2.2.2. データの内容を編集する
3章 変数の種類と記述統計
3.1. 統計解析における変数の種類
3.2. 記述統計量の計算
3.2.1. 連続変数の要約
3.2.2. 離散変数の要約
3.3. 背景表の作成
3.3.1. 背景表の作成手順
3.3.2. 背景表のラベル指定
4章 統計的仮説検定
4.1. 統計的仮説検定の基本的な考え方
4.1.1. 仮説検定と検定問題
4.1.2. p値
4.1.3. 有意水準と第1種の過誤
4.1.4. 第2種の過誤と検出力
4.1.5. 帰無仮説が棄却されない場合の解釈
4.2. 仮説検定の選び方
4.2.1. Q1.差か相関か?
4.2.2. Q2.データ間に対応はあるか?
4.2.3. Q3.アウトカムの変数の種類は?
4.2.4. Q4.連続変数のアウトカムの正規性の仮定は満たされているか?
4.2.5. Q5.比較群は2群か3群以上か?
4.3. 連続変数のアウトカムを2群間で比較する場合
4.3.1. Studentのt検定
4.3.2. 等分散性の確認とF検定
4.3.3. Welchのt検定
4.3.4. 正規性の仮定の確認とRによる簡単な作図
4.3.5. Mann-WhitneyのU検定
4.4. 連続変数のアウトカムを3群間以上で比較する場合
4.4.1. 多重検定と多重性の問題
4.4.2. 一元配置の分散分析
4.4.3. Kruskal-Wallisの順位和検定
4.5. アウトカムを連続変数によって説明する場合
4.5.1. 相関係数とは?
4.5.2. Pearsonの積率相関係数
4.5.3. Spearmanの順位相関係数
4.5.4. Kendallの順位相関係数
4.6. 離散変数のアウトカムデータを複数群間で比較する場合
4.6.1. カイ二乗検定
4.6.2. Fisherの正確検定
4.7. 生存時間を評価する場合
4.7.1. 生存時間と打ち切り
4.7.2. Kaplan-Meier法
4.7.3. Kaplan-Meier曲線の作図
4.7.4. Log-rank検定
5章 回帰モデル
5.1. 回帰モデルの選び方
5.2. 線形回帰モデル
5.2.1. 線形回帰モデルの基本
5.2.2. 線形回帰モデルの仮定の評価
5.2.3. 説明変数が二値変数の場合
5.2.4. 説明変数が三値以上の離散変数の場合
5.3. 目的変数が二値変数の場合
5.3.1. ロジスティック回帰モデルによるオッズ比の推定
5.3.2. 修正ポアソン回帰モデルによるリスク比の推定
5.3.3. 修正ポアソン回帰モデルによるリスク差の推定
5.3.4. リスク比とオッズ比の違い
5.4. 目的変数がイベント発生までの時間の場合
5.4.1. Cox比例ハザード回帰モデル
5.4.2. 比例ハザード性の評価
6章 多変量回帰モデル
6.1. 多変量回帰モデルの基本
6.1.1 単回帰モデルのおさらいと多変量回帰モデルの実装
6.1.2. 多変量回帰モデルのメカニズム
6.2. 効果の異質性の評価
6.2.1 交差項を含む回帰モデル
6.2.2. サブグループの効果推定
6.2.3. 交差項を含むモデルの総括的検定
6.2.4. 効果の推定量が比であるときの異質性の評価
6.3. 説明変数の選択
6.3.1. モデルの過適合のチェック
6.3.2. 多重共線性のチェック
6.4. 欠測値補完
7章 結果のアウトプット
7.1. 解析結果を表にまとめる
7.2. 解析結果を図にまとめる
7.2.1. ggplotの基本とヒストグラム
7.2.2. 関数scaleによる図の調整
7.2.3. 関数facetによる図の分割
7.2.4. 箱ひげ図の作成
7.2.5. 複数の図の統合
7.2.6. Kaplan-Meier図
7.2.7. 回帰モデルの結果の図示
7.3. R Markdownで解析レポートを作成する
7.3.1. R Markdownファイルを作成して実行する
7.3.2. R Markdownを構成する要素
7.3.3. R Markdownによる解析レポートの作成
付録
A.1. Rとパッケージのアップデート
A.2. RStudioでの作業を楽にする豆知識
A.2.1. ショートカットキー
A.2.2. tabキーによるコード補完機能
参考文献