2026年1月8日 / 最終更新日時 : 2026年1月8日 s1inagaki Blog 実務家大学院生のための「学術発表」の作法 実務の現場で活躍されている皆さんが、「研究的な」プレゼンをする際、直面する問題に「作法」の違いがあるようです。 「価値のある経験や示唆」だと感じられる演題も、学術発表の作法に沿っていないために、「研究としては判断できない […]
2025年11月4日 / 最終更新日時 : 2025年11月5日 s1inagaki Blog 10/31補足:2時点データ分析の考え方 10月31日の演習では、2時点(例:T1=前、T2=後)のデータ分析を行いました。 演習時には、ファイルの読み込みと前処理に力を注ぎすぎてしまったことから、意義がありそうな分類に手が回らない状況が発生してしまいました。こ […]
2025年10月31日 / 最終更新日時 : 2025年10月31日 s1inagaki Blog ロバスト標準誤差(Robust Standard Errors)の考え方 回帰分析では、残差(誤差)の分散が「どの観測でも同じである(等分散)」という前提を置いています。しかし、実際のデータではこの前提が崩れていることが多く、異分散や相関した誤差が存在します。そのまま分析を行うと、標準誤差(S […]
2025年10月31日 / 最終更新日時 : 2025年10月31日 s1inagaki Blog 1031演習内容(Part3 個人ワーク用) 初回の演習で「1セル1情報(1 cell = 1 piece of information)」という Tidyデータの原則をお伝えしました。つまり、1行が1つの観測対象、1列が1つの変数であるように整える、という考え方で […]
2025年10月30日 / 最終更新日時 : 2025年11月5日 s1inagaki DS授業 1031演習内容(Part2) 1031演習内容&目標 1.2時点データを分析可能な形に構築できる。(データ結合、変数整合、パネル/反復横断の決定) 2.2時点間の「変化」を適切に記述・検定できる。(t検定、クロス集計、マクネマー検定など) 3.「変化 […]
2025年10月30日 / 最終更新日時 : 2025年10月31日 s1inagaki Blog 1031演習内容(Part1) 1031演習内容&目標 1.2時点データを分析可能な形に構築できる。(データ結合、変数整合、パネル/反復横断の決定)2.2時点間の「変化」を適切に記述・検定できる。(t検定、クロス集計、マクネマー検定など)3.「変化の要 […]
2025年10月30日 / 最終更新日時 : 2025年10月30日 s1inagaki Blog Ma.09. 次元削減 今回の分析(naiman)では、変数が340個もあり、正直うんざりするほどの質問数です。さらに言えば、構造化されていない(理論的に整理されていない)質問群なので、どのように変数を扱えばよいのかが分かりにくい、という難しさ […]
2025年10月30日 / 最終更新日時 : 2025年10月30日 s1inagaki Blog Ma.08 XxYyの悩みへの対応(演習版に修正前) データセットを結合できるのことは、データサイエンス的な一つのゴールと言って良いと思っています。必要な変数を自分で考えて、データセットを構築すること、に意味があると思います。 そのうえで、悩ましい問題に対応していかなければ […]
2025年10月30日 / 最終更新日時 : 2025年10月30日 s1inagaki Blog Ma.05.差の検定 データセット(df)を使い、統計的検定と効果量の使い方を確認しました。 ゴール: p値だけに頼らず、①データの分布(視覚化)、②検定の前提条件、③効果量と信頼区間の3点を確認する習慣をつけます。 1. 2群の比較 (性別 […]
2025年10月30日 / 最終更新日時 : 2025年10月30日 s1inagaki Blog Ma.04.ggplot2 グラフ作成 復習 Rのggplot2パッケージを使った基本的なグラフ作成(箱ひげ図、散布図、ヒストグラム)の手順を復習するためのものです。授業で学んだコードを見直しながら、グラフをステップアップさせていく方法を確認してください。 1. 箱 […]
2025年10月30日 / 最終更新日時 : 2025年10月31日 s1inagaki Blog Ma.03.「前処理」等復習用(Tidyverse的) このページは、演習で活用した前処理に必要なRのTIPS(技)をまとめました。分析のワークフローに沿って、各ステップの「目的」と「コピーして使えるコード」を紹介しています。演習で使った資料を参考に生成AIの助けを得ながら公 […]
2025年10月23日 / 最終更新日時 : 2025年10月30日 s1inagaki Blog Ma.02 オープンデータを活用する データ分析のマイプロジェクト(naimanの発表会以降の分析)を始めるにあたり、最初の関門は「どこにデータがあるか」だと思います。データそのものは、インターネット上に広く公開されていますが、玉石混交です。 せっかくならば […]
2025年10月22日 / 最終更新日時 : 2025年10月30日 s1inagaki Blog Ma.01. SSDSEを活用 SSDSEは使いやすいようで使いにくい。どうデータセットの中で何かを分析する場合には、扱いやすいが、どの変数もあまり関心を集めない。変数名が丁寧な日本語なので、一つづつ真面目にRenameしないといけない。せめてローマ字 […]
2025年6月25日 / 最終更新日時 : 2025年10月30日 s1inagaki Blog P7. データセットを吐き出す 社会調査で得られる生データは、料理で言えば「土が付いたままの野菜」や「まだ活きている魚」のようなものです。これをそのまま調理(分析)しようとするのは、あまりに乱暴で、美味しくない(正しくない)結果に繋がってしまいます。 […]
2025年6月18日 / 最終更新日時 : 2025年10月30日 s1inagaki Blog P6. 新しい変数(因子型)を定義Mutateする 入力されたデータを眺めていても、解釈が難しいことがあります。こんな時、①先行研究などで示されている「カットオフ値」を使ったり、②自分で考えた任意の基準でグループ分けしたりすることで、解釈しやすいカテゴリ変数(例:「ハイリ […]
2025年6月17日 / 最終更新日時 : 2025年10月30日 s1inagaki Blog P5.モックデータを作る・変数辞書を活用する 大切な自分のデータセットを扱うためにAIを使って下調べをするのは有用です。まずは、AIに以下のようにお願いして、Mockデータを作ってもらってください。 RやPythonで使える、以下の条件を満たす欠損値なしのシミュレー […]
2025年6月17日 / 最終更新日時 : 2025年10月30日 s1inagaki Blog P4.2. across関数で複数列をまとめて処理する naiman_c3 <- naiman_c2 %>% mutate(across( starts_with(“q4s”), ~ 11 – .x )) このコード […]
2025年6月11日 / 最終更新日時 : 2025年10月30日 s1inagaki Blog P4_mutate関数でデータの前処理をする 生データをそのままデータ分析できることは稀です。特に授業で扱う社会調査結果では、アンケートの回答がズレていたり、複数の質問項目を組み合わせて新しい「尺度」を作る必要があったりと、何らかの「前処理」が欠かせません。 前処理 […]
2025年6月11日 / 最終更新日時 : 2025年10月30日 s1inagaki Blog P3_変数型についての補足 ExcelデータをRに読み込んだら最初にすること RにExcelデータを読み込んだら、まずはデータの中身をざっくり確認しましょう。glimpse(オブジェクト名) を使うと、変数名・データ型・一部の値などが一覧で表示され […]
2025年6月11日 / 最終更新日時 : 2025年10月30日 s1inagaki Blog P2_ファイル(データセット)を読み込む 授業で受けとったファイル(データセット)をRで読み込む方法を説明します。 データ分析を始めるための最初のステップは、分析対象のファイル(データセット)をRStudioに読み込むことです。ここでは、初心者でも直感的に操作で […]
2025年6月9日 / 最終更新日時 : 2025年10月30日 s1inagaki Blog P1_RStudioプロジェクトの作成 RStudioの画面 Rプロジェクトの作成 RStudioには「プロジェクト」という強力な機能があります。これは、データ分析に必要な全てのファイル(スクリプト、データ、結果など)を一つの専用フォルダにまとめて管理する仕組 […]