1031演習内容(Part2)
1031演習内容&目標
1.2時点データを分析可能な形に構築できる。
(データ結合、変数整合、パネル/反復横断の決定)
2.2時点間の「変化」を適切に記述・検定できる。
(t検定、クロス集計、マクネマー検定など)
3.「変化の要因」を特定する統計モデルを選択・実行・解釈できる。
(ANCOVA:変化量モデル、T2目的変数モデル、ANCOVAモデル)
4.多時点のデータ操作に備えて、データ構造を操作できる。
(ワイド形式からロング形式への変換)
2時点間の「変化」を適切に記述・検定できる。
キーとなる演習内容、確認内容は以下のとおりです
- Q1: 2022年と2024年でこの集団(両時点で回答した人)の生活満足度(q1_1)に差はないと言えますか?
2022年と2024年におけるq1_1の差分の代表値を示してください。(q1_1のT2-T1 での差分はどんな分布でしょうか)
2022年と2024年におけるq1_1の差をヒストグラム化してください。
2022年と2024年で、q1_1に有意な差があるかを検定してください。 - Q2: 2022年と2024年でこの集団の介護実施状況(家族の介護必要状況)に差はないと言えますか?
なお、この問いに答えるには、df上の介護状況のデータの持ち方を統一してやる必要があります。
2022はq10s1 1→介護あり 2→介護なし
2024はq13_1 YES==介護なし No==介護あり
2022年に介護が必要な家族がいた人は全体の何%ですか?
2024年に介護が必要になった家族がいた人は全体の何%ですか?
2022年と2024年でこの集団の介護必要状況に差はないといえますか?
その際にT1xT2のクロス集計を作成してください。ctable <- table(df$var_a, df$var_b)
Q2の状況から、頭の中で、どのような仮説が浮かび上がりましたか?
「変化の要因」を特定する統計モデルを選択・実行・解釈できる。
- Q3:生活満足度変化量(dq1)に家族の介護状況は、どの程度関連するといえますか?
・まずは差分を取って、変数(例えばdq1)にする。
・dq1を目的変数にして、介護状況の変化を共変量にいれて、Lmを組む→評価する - Q4:T1の生活満足度を調整したとき、T2の生活満足度を予測するときに家族の介護状況は関連するといえるか?
・Q3のモデルに対して、ツッコミの心を持つ
(T1が高い人は上がる余地が少ないのでは?逆に、T1が低い人は、自然に上がりやすいのでは?)
・T2のq1_1を目的変数にして、T1のq1_1を説明変数に加え、さらに共変量として介護状況を組み込み、lmを組む→評価する
介護状況のMutateのヒント
やっていることはわかりますでしょうか…
mutate(care_need_T1 = case_when(q10s1 == 1 ~ 1,
q10s1 == 2 ~ 0),
care_need_T2 = case_when(q13_1 == “Yes” ~ 0,
q13_1 == “No” ~ 1) )
このcare_need_T1を活用すれば、以下の4群にわけることができます。
1 安定して介護不要 2 介護要になる 3 安定して介護要 4 介護が不要化
(その4群はFactor化するのが良いと思います。数値やOrdered型ではない)

