「様々な差の検定」

期間限定で、絶対に了解しておいてほしいところだけ、
重要な解説をすっ飛ばした、あまり良くない教材を どうしても時間がない人向けにUpします。

※このあと、検定を複数回(おそらく10-20回程度)の検定をすることになると思います。
 実際に検定をしながら、きっちりとした教材を使いながら学習をしてくださいね。
 (ネットにもよい教材はたくさんあります)
 あくまでもこの資料は緊急避難的にPBLをするためのものです。

はじめに:検定手法を選ぶための3つのステップ

分析したい内容に合わせて適切な検定手法を選ぶには、主に以下の3つの点を確認する必要があります。

  1. 比較したいグループの数と「対応」の有無
    • 2つのグループを比較しますか? (例:男女)
    • 3つ以上のグループを比較しますか? (例:収入の3区分)
    • グループ間のデータは独立ですか(対応なし)? (例:男性群と女性群は別々の人)
    • グループ間のデータは関連していますか(対応あり)? (例:同じ人が介入前と後で回答)
  2. 分析したい変数の「尺度」
    • 間隔尺度・比率尺度ですか? (例:満足度(0-10点)、年齢、体重など。平均値を計算することに意味がある変数)
    • 名義尺度ですか? (例:男女、リスク分類(高/低)、血液型など。カテゴリー分類のための変数)
    • 順序尺度ですか? (例:満足度(不満/普通/満足)、成績(優/良/可)など。順序には意味があるが、間隔は等しくない変数)
  3. データの「分布」
    • 分析したいデータは正規分布に従っていると仮定できますか?
    • 正規分布に従わない、またはサンプルサイズが小さい場合は、ノンパラメトリック検定を用いる必要があります。

具体的な分析ケースと検定手法

Case 1:2つの独立したグループの平均値を比較する

  • 問いの例: 男女で生活満足度(0-10点評価)の平均点に差はあるか?
  • 変数の種類:
    • グループ分け変数:男女(名義尺度、2群)
    • 比較する変数:生活満足度(間隔尺度)
  • 推奨される検定手法:
    • パラメトリック検定: 独立な2群のt検定 (Student’s t-test)
      • 補足: 等分散性が仮定できない場合は、Welchのt検定を用いるのがより安全である。
    • ノンパラメトリック検定: Mann-WhitneyのU検定
      • 使いどころ: 生活満足度のデータ(y:目的変数となるデータ)が正規分布に従わない場合に使用する。

Case 2:3つ以上の独立したグループの平均値を比較する

  • 問いの例: 収入(低い・中程度・高い)で生活満足度(0-10点評価)の平均点に差はあるか?
  • 変数の種類:
    • グループ分け変数:収入(順序尺度だが、ここでは3つの独立したグループとして扱う、3群以上)
    • 比較する変数:生活満足度(間隔尺度)
  • 推奨される検定手法:
    • パラメトリック検定: 一元配置分散分析 (ANOVA)
      • 補足: ANOVAで統計的に有意な差が見られた場合、具体的にどのグループ間に差があるのかを調べるために多重比較法 (TukeyのHSD法、Bonferroni法など) を行う。
    • ノンパラメトリック検定: Kruskal-Wallis検定
      • 使いどころ: データが正規分布に従わない場合。こちらも有意差があった場合は多重比較が必要です。

Case 3:グループ間でカテゴリー変数の比率を比較する

  • 問いの例: 男女で、Kessler6のスクリーニング結果(低リスク vs 高リスク)の割合に差はあるか?
  • 変数の種類:
    • グループ分け変数:男女(名義尺度)
    • 比較する変数:K6のリスク分類(名義尺度)
  • 推奨される検定手法: カイ二乗(chi2)検定 (独立性の検定)
    • 補足: どのセルで差が大きいのかを見るためには「残差分析」が有効です。

Case 4:対応のある(同じ人の)3つ以上の時点・条件の値を比較する

  • 問いの例: ある人が、仕事、家庭、趣味など13個の生活のサブエリアについて満足度(0-10点)を評価した。これらのサブエリア間で満足度に差はあるか?
  • 変数の種類:
    • 比較する条件:サブエリア(名義尺度、3条件以上)
    • 比較する変数:満足度(間隔尺度)
    • 対応: あり(同一人物が全条件に同一の尺度で回答)
  • 推奨される検定手法:
    • パラメトリック検定: 一元配置の反復測定分散分析 (Repeated Measures ANOVA)
    • ノンパラメトリック検定: Friedman検定
      • 使いどころ: データが正規分布に従わない場合。