2025年11月4日 / 最終更新日時 : 2025年11月5日 s1inagaki Blog 10/31補足:2時点データ分析の考え方 10月31日の演習では、2時点(例:T1=前、T2=後)のデータ分析を行いました。 演習時には、ファイルの読み込みと前処理に力を注ぎすぎてしまったことから、意義がありそうな分類に手が回らない状況が発生してしまいました。こ […]
2025年10月31日 / 最終更新日時 : 2025年10月31日 s1inagaki Blog ロバスト標準誤差(Robust Standard Errors)の考え方 回帰分析では、残差(誤差)の分散が「どの観測でも同じである(等分散)」という前提を置いています。しかし、実際のデータではこの前提が崩れていることが多く、異分散や相関した誤差が存在します。そのまま分析を行うと、標準誤差(S […]
2025年10月31日 / 最終更新日時 : 2025年10月31日 s1inagaki Blog 1031演習内容(Part3 個人ワーク用) 初回の演習で「1セル1情報(1 cell = 1 piece of information)」という Tidyデータの原則をお伝えしました。つまり、1行が1つの観測対象、1列が1つの変数であるように整える、という考え方で […]
2025年10月30日 / 最終更新日時 : 2025年10月31日 s1inagaki Blog 1031演習内容(Part1) 1031演習内容&目標 1.2時点データを分析可能な形に構築できる。(データ結合、変数整合、パネル/反復横断の決定)2.2時点間の「変化」を適切に記述・検定できる。(t検定、クロス集計、マクネマー検定など)3.「変化の要 […]
2025年10月30日 / 最終更新日時 : 2025年10月30日 s1inagaki Blog Ma.09. 次元削減 今回の分析(naiman)では、変数が340個もあり、正直うんざりするほどの質問数です。さらに言えば、構造化されていない(理論的に整理されていない)質問群なので、どのように変数を扱えばよいのかが分かりにくい、という難しさ […]
2025年10月30日 / 最終更新日時 : 2025年10月30日 s1inagaki Blog Ma.08 XxYyの悩みへの対応(演習版に修正前) データセットを結合できるのことは、データサイエンス的な一つのゴールと言って良いと思っています。必要な変数を自分で考えて、データセットを構築すること、に意味があると思います。 そのうえで、悩ましい問題に対応していかなければ […]
2025年10月30日 / 最終更新日時 : 2025年10月30日 s1inagaki Blog Ma.05.Rで簡単な「予測」を試みる Rを使って「予測」を試みて、その結果をどう解釈すればよいかを復習します。相関分析から線形回帰、ロジスティック回帰まで、ステップバイステップで進めます。「モデルを作って終わり」ではなく、そのモデルが「本当に使えるのか?」を […]
2025年10月30日 / 最終更新日時 : 2025年10月30日 s1inagaki Blog Ma.05.差の検定 データセット(df)を使い、統計的検定と効果量の使い方を確認しました。 ゴール: p値だけに頼らず、①データの分布(視覚化)、②検定の前提条件、③効果量と信頼区間の3点を確認する習慣をつけます。 1. 2群の比較 (性別 […]
2025年10月30日 / 最終更新日時 : 2025年10月30日 s1inagaki Blog Ma.04.ggplot2 グラフ作成 復習 Rのggplot2パッケージを使った基本的なグラフ作成(箱ひげ図、散布図、ヒストグラム)の手順を復習するためのものです。授業で学んだコードを見直しながら、グラフをステップアップさせていく方法を確認してください。 1. 箱 […]
2025年10月30日 / 最終更新日時 : 2025年10月31日 s1inagaki Blog Ma.03.「前処理」等復習用(Tidyverse的) このページは、演習で活用した前処理に必要なRのTIPS(技)をまとめました。分析のワークフローに沿って、各ステップの「目的」と「コピーして使えるコード」を紹介しています。演習で使った資料を参考に生成AIの助けを得ながら公 […]
2025年10月23日 / 最終更新日時 : 2025年10月30日 s1inagaki Blog Ma.02 オープンデータを活用する データ分析のマイプロジェクト(naimanの発表会以降の分析)を始めるにあたり、最初の関門は「どこにデータがあるか」だと思います。データそのものは、インターネット上に広く公開されていますが、玉石混交です。 せっかくならば […]
2025年10月22日 / 最終更新日時 : 2025年10月30日 s1inagaki Blog Ma.01. SSDSEを活用 SSDSEは使いやすいようで使いにくい。どうデータセットの中で何かを分析する場合には、扱いやすいが、どの変数もあまり関心を集めない。変数名が丁寧な日本語なので、一つづつ真面目にRenameしないといけない。せめてローマ字 […]
2025年6月25日 / 最終更新日時 : 2025年6月25日 s1inagaki Blog P8. ターゲットリストを使ったフラグ変数の作成 2つのデータフレームを結合するleft_joinなどを学ぶ前に、よりシンプルな「情報の接続」方法を紹介します。 例えば、e-Statなどの外部データから「出生率が低い都道府県のリスト」を入手します。このリストを使って […]
2025年6月25日 / 最終更新日時 : 2025年10月30日 s1inagaki Blog P7. データセットを吐き出す 社会調査で得られる生データは、料理で言えば「土が付いたままの野菜」や「まだ活きている魚」のようなものです。これをそのまま調理(分析)しようとするのは、あまりに乱暴で、美味しくない(正しくない)結果に繋がってしまいます。 […]
2025年6月18日 / 最終更新日時 : 2025年10月30日 s1inagaki Blog P6. 新しい変数(因子型)を定義Mutateする 入力されたデータを眺めていても、解釈が難しいことがあります。こんな時、①先行研究などで示されている「カットオフ値」を使ったり、②自分で考えた任意の基準でグループ分けしたりすることで、解釈しやすいカテゴリ変数(例:「ハイリ […]
2025年6月17日 / 最終更新日時 : 2025年10月30日 s1inagaki Blog P5.モックデータを作る・変数辞書を活用する 大切な自分のデータセットを扱うためにAIを使って下調べをするのは有用です。まずは、AIに以下のようにお願いして、Mockデータを作ってもらってください。 RやPythonで使える、以下の条件を満たす欠損値なしのシミュレー […]
2025年6月17日 / 最終更新日時 : 2025年10月30日 s1inagaki Blog P4.2. across関数で複数列をまとめて処理する naiman_c3 <- naiman_c2 %>% mutate(across( starts_with(“q4s”), ~ 11 – .x )) このコード […]
2025年6月11日 / 最終更新日時 : 2025年10月30日 s1inagaki Blog P4_mutate関数でデータの前処理をする 生データをそのままデータ分析できることは稀です。特に授業で扱う社会調査結果では、アンケートの回答がズレていたり、複数の質問項目を組み合わせて新しい「尺度」を作る必要があったりと、何らかの「前処理」が欠かせません。 前処理 […]
2025年6月11日 / 最終更新日時 : 2025年10月30日 s1inagaki Blog P3_変数型についての補足 ExcelデータをRに読み込んだら最初にすること RにExcelデータを読み込んだら、まずはデータの中身をざっくり確認しましょう。glimpse(オブジェクト名) を使うと、変数名・データ型・一部の値などが一覧で表示され […]
2025年6月11日 / 最終更新日時 : 2025年10月30日 s1inagaki Blog P2_ファイル(データセット)を読み込む 授業で受けとったファイル(データセット)をRで読み込む方法を説明します。 データ分析を始めるための最初のステップは、分析対象のファイル(データセット)をRStudioに読み込むことです。ここでは、初心者でも直感的に操作で […]
2025年6月9日 / 最終更新日時 : 2025年10月30日 s1inagaki Blog P1_RStudioプロジェクトの作成 RStudioの画面 Rプロジェクトの作成 RStudioには「プロジェクト」という強力な機能があります。これは、データ分析に必要な全てのファイル(スクリプト、データ、結果など)を一つの専用フォルダにまとめて管理する仕組 […]
2025年5月29日 / 最終更新日時 : 2025年7月25日 s1inagaki Blog 愛知県東浦町の大規模社会調査 愛知県東浦町の社会調査に関心を寄せています。 2024年度より始動した「東浦研究」は、健康長寿を軸とした縦断疫学研究として、愛知県東浦町をフィールドに展開しているそうです。研究主体には国立長寿医療研究センターであり、共同 […]
2025年4月23日 / 最終更新日時 : 2025年6月11日 s1inagaki Blog 2025 PBL演習 稲垣担当のPBLでは、内閣府の調査「2024年 満足度・生活の質に関する調査」を活用した演習をしています。 内閣府HPより この科目では、単にデータ分析の手法を学ぶだけではありません。「現実の社会課題」に向き合いながら、 […]
2023年6月8日 / 最終更新日時 : 2023年6月8日 s1inagaki Blog チーム形成について 演習において、英語学習において、そして患者グループにおいて、私は様々なチームと仕事をしています。曲がりなりにも、動機(モチベーション)の研究をしているものとして、チームを理解することを避けられません。 ワシントン大学でC […]
2023年4月28日 / 最終更新日時 : 2023年4月28日 s1inagaki Blog 英語の学習 当学ではEnglish Extra!と題して、英会話のスキルを磨く時間があります。海外の大学院を目指す学生さんもいるようなので、こちらで2023年現在、利用しやすいコンテンツを紹介します。 Chat GPT Google […]
2023年4月25日 / 最終更新日時 : 2023年4月26日 s1inagaki Blog Relationship between Diabetes Self-Management and the Use of Health Care Apps: A Cross-Sectional Study 掲載 ACI Open誌より拙稿がパブリッシュされました。 2型糖尿病をもつ人にオンラインアンケートをしたところ、24.1% がヘルスケア アプリを使用していました。(60 歳以上でも約 20% がヘルスケア アプリも使用)ヘ […]
2023年1月10日 / 最終更新日時 : 2023年4月26日 s1inagaki Blog Diabetes-related shame among people with type 2 diabetes: an internet-based cross-sectional study 掲載 BMJ Open Diabetes Research and Care誌より拙稿がパブリッシュされました。 感情的苦痛の中でも、羞恥心は人間の感情体験の中で最も苦痛を伴い、障害を与えるものとして分類されています。(リンク […]