P2_ファイル(データセット)を読み込む

授業で受けとったファイル(データセット)をRで読み込む方法を説明します。

データ分析を始めるための最初のステップは、分析対象のファイル(データセット)をRStudioに読み込むことです。
ここでは、初心者でも直感的に操作できる方法と、分析の再現性を高めるための重要な手順を解説します。

※ 第4回以降でRDSファイルを読み込む際は、この方法を応用します。


1. Environmentパネルを操作する

「Import Dataset」をクリック
RStudioの右上にある「Environment」パネルにある 「Import Dataset」 をクリックする。

ファイル形式を選択
読み込むファイルの形式を選ぶメニューが表示されます。授業で最初に使うのは、Excelファイルです。

Excelファイルの場合: From Excel... 
CSVファイルの場合: From Text (base)... または From Text (readr)...

 

2.Import Excel Dataコンソールを操作する。

3ステップで右下のCode Previewに美しいコードを作成させる。

①Browseで、読み込みたいファイルを指定する。
②Import Optionsをカスタマイズする。
③Code Previewからコピーする。
④閉じる。

Import Options を使いこなすコツ

Name(データセット名):短く分かりやすい「半角英数」の名前にする
なぜ? ファイル名は長くて不便!日本語が含まれるなどエラーの原因になる
どうする? survey2024、(内閣満足度だから)naimanなど のように、短く・意味が分かり・半角英数字の名前がよい。

Sheet(シート):目的のデータがあるシートを選ぶ
なぜ? Excelファイルには、アンケートのローデータ、集計結果、メモなど、複数のシートが含まれていることがよくある。
どうする? ドロップダウンリストから、シート名を選択する。上のプレビューも連動して変わるので確認する。

Skip(スキップ):ファイルの「タイトル行」を飛ばしてデータ本体から読み込む
なぜ?(特に行政系)調査データには、1行目に「〇〇に関する調査結果」、2行目に「調査日:2024年XX月XX日」といった、データそのものではない情報が含まれることがある。
どうする? プレビュー画面を見て、データ本体(通常は変数名が並んだ行)が何行目から始まっているかを確認する。
     例えば、データ本体が5行目から始まっている場合、その手前にある4行を飛ばしたいので、Skipの欄に 4 と入力します。
     プレビュー画面の1行目に変数名がきれいに並んだら成功です。

First Name as Name (先頭行を変数名にしますよ?):チェックする!

Open Data Viewer (読み込んだら開きますか?):チェック不要!


3.ソースパネルに入れ込む

貼り付ける。
glimpse(オブジェクト名・データセット名)を追加して、きちんと読み込めているかチェック

次の記事

P3_PBL変数型についての補足