2025年10月31日 / 最終更新日時 : 2025年10月31日 s1inagaki Blog ロバスト標準誤差(Robust Standard Errors)の考え方 回帰分析では、残差(誤差)の分散が「どの観測でも同じである(等分散)」という前提を置いています。しかし、実際のデータではこの前提が崩れていることが多く、異分散や相関した誤差が存在します。そのまま分析を行うと、標準誤差(S […]
2025年10月31日 / 最終更新日時 : 2025年10月31日 s1inagaki Blog 1031演習内容(Part3 個人ワーク用) 初回の演習で「1セル1情報(1 cell = 1 piece of information)」という Tidyデータの原則をお伝えしました。つまり、1行が1つの観測対象、1列が1つの変数であるように整える、という考え方で […]
2025年10月30日 / 最終更新日時 : 2025年11月5日 s1inagaki DS授業 1031演習内容(Part2) 1031演習内容&目標 1.2時点データを分析可能な形に構築できる。(データ結合、変数整合、パネル/反復横断の決定) 2.2時点間の「変化」を適切に記述・検定できる。(t検定、クロス集計、マクネマー検定など) 3.「変化 […]
2025年10月30日 / 最終更新日時 : 2025年10月31日 s1inagaki Blog 1031演習内容(Part1) 1031演習内容&目標 1.2時点データを分析可能な形に構築できる。(データ結合、変数整合、パネル/反復横断の決定)2.2時点間の「変化」を適切に記述・検定できる。(t検定、クロス集計、マクネマー検定など)3.「変化の要 […]
2025年10月30日 / 最終更新日時 : 2025年10月30日 s1inagaki Blog Ma.09. 次元削減 今回の分析(naiman)では、変数が340個もあり、正直うんざりするほどの質問数です。さらに言えば、構造化されていない(理論的に整理されていない)質問群なので、どのように変数を扱えばよいのかが分かりにくい、という難しさ […]
2025年10月30日 / 最終更新日時 : 2025年10月30日 s1inagaki Blog Ma.08 XxYyの悩みへの対応(演習版に修正前) データセットを結合できるのことは、データサイエンス的な一つのゴールと言って良いと思っています。必要な変数を自分で考えて、データセットを構築すること、に意味があると思います。 そのうえで、悩ましい問題に対応していかなければ […]
2025年10月30日 / 最終更新日時 : 2025年10月30日 s1inagaki Blog Ma.05.Rで簡単な「予測」を試みる Rを使って「予測」を試みて、その結果をどう解釈すればよいかを復習します。相関分析から線形回帰、ロジスティック回帰まで、ステップバイステップで進めます。「モデルを作って終わり」ではなく、そのモデルが「本当に使えるのか?」を […]
2025年10月30日 / 最終更新日時 : 2025年10月30日 s1inagaki Blog Ma.05.差の検定 データセット(df)を使い、統計的検定と効果量の使い方を確認しました。 ゴール: p値だけに頼らず、①データの分布(視覚化)、②検定の前提条件、③効果量と信頼区間の3点を確認する習慣をつけます。 1. 2群の比較 (性別 […]
2025年10月30日 / 最終更新日時 : 2025年10月30日 s1inagaki Blog Ma.04.ggplot2 グラフ作成 復習 Rのggplot2パッケージを使った基本的なグラフ作成(箱ひげ図、散布図、ヒストグラム)の手順を復習するためのものです。授業で学んだコードを見直しながら、グラフをステップアップさせていく方法を確認してください。 1. 箱 […]
2025年10月30日 / 最終更新日時 : 2025年10月31日 s1inagaki Blog Ma.03.「前処理」等復習用(Tidyverse的) このページは、演習で活用した前処理に必要なRのTIPS(技)をまとめました。分析のワークフローに沿って、各ステップの「目的」と「コピーして使えるコード」を紹介しています。演習で使った資料を参考に生成AIの助けを得ながら公 […]
2025年10月23日 / 最終更新日時 : 2025年10月30日 s1inagaki Blog Ma.02 オープンデータを活用する データ分析のマイプロジェクト(naimanの発表会以降の分析)を始めるにあたり、最初の関門は「どこにデータがあるか」だと思います。データそのものは、インターネット上に広く公開されていますが、玉石混交です。 せっかくならば […]
2025年10月22日 / 最終更新日時 : 2025年10月30日 s1inagaki Blog Ma.01. SSDSEを活用 SSDSEは使いやすいようで使いにくい。どうデータセットの中で何かを分析する場合には、扱いやすいが、どの変数もあまり関心を集めない。変数名が丁寧な日本語なので、一つづつ真面目にRenameしないといけない。せめてローマ字 […]