P1_RStudioプロジェクトの作成

RStudioの画面

  • ソースペイン(左上):スクリプトやR Markdownを書くところ
  • コンソール(左下):直接コマンドを打ち込む
  • 環境・履歴(右上):変数や履歴を確認できる
  • プロット・ファイル・パッケージ(右下):図や出力、パッケージの管理など

Rプロジェクトの作成

RStudioには「プロジェクト」という強力な機能があります。
これは、データ分析に必要な全てのファイル(スクリプト、データ、結果など)を一つの専用フォルダにまとめて管理する仕組みです。

プロジェクトを使うべき主な理由は以下の通りです。

  1. 作業の整理
    • 関連ファイルがすべて一つのフォルダにまとまるため、探し物がなくなり、作業効率が格段に上がります。
  2. setwd()不要!
    • プロジェクトを開くと、そのフォルダが自動的に作業ディレクトリになります。
      作業ディレクトリを指定する手間が省け、パス指定ミスによるエラーも防げます。
  3. 再現性・共同作業の向上
    • プロジェクトは必要なファイルを全て集約しているため、他のPCでも簡単に同じ環境で作業を再開できます。
      コードが誰のPCでも正しく動き、共同作業もスムーズになります。
  4. RStudioとの連携
    • RStudioはプロジェクト専用ファイル(.Rproj)で簡単に開け、作業環境を瞬時に再現します。


プロジェクトを作成することで、作業の一元化・再現性・共有のしやすさが確保されます。
授業では必ず作成してください。
実際に新しいプロジェクトを作成してみましょう。

RStudioで新しいプロジェクトを作成する手順

(例:FileNew ProjectNew DirectoryNew Project → フォルダ名の入力 → Create Project


使用するデータセットの配置場所とプロジェクト構造

授業で配布されたデータセットや、分析に使うファイルは、作成したRStudioプロジェクトのフォルダ内に整理して保存するのが、最も効率的でエラーを防ぐ方法です。

なぜプロジェクトフォルダ内に置くのか?

RStudioプロジェクトを使う最大の利点は、作業に必要な全てのファイルが自動的に整理され、コードの「再現性」が飛躍的に高まる点です。

  • コードがシンプルになる: ファイルの場所を指定するsetwd()コマンドを書く必要がなくなり、コードが分かりやすくなります。
  • どこでも同じように動く: あなたのコードを他のPCで実行したり、プロジェクトメンバーと共有する際も、プロジェクトフォルダの構造が同じであれば、ファイルが見つからないといったトラブルが起こりにくくなります。

理想的なプロジェクトフォルダの構造例

データセットを効率的に管理し、他のスクリプトや出力ファイルと明確に区別するために、以下のようなプロジェクト構造をお勧めします。

PBLProject/ ← プロジェクトのルートフォルダ(ここにPBLProject.Rprojがあります)
├── data/ ← ① データファイルを置く専用フォルダ
│ └── naimanraw.xls (例:分析で使用するExcelファイル)
├── scripts/ ← ② Rスクリプト(.Rファイル)を保存するフォルダ
│ └── 0500_maesyori_naiman.R (例:データ前処理用のスクリプト)
│ └── 05_sex_hikaku_wellbeing.R (例:男女比較分析用のスクリプト)
├── output/ ← ③ 分析結果の図や表、レポートなどを出力するフォルダ
└── PBLProject.Rproj ← ④ RStudioプロジェクトファイル(プロジェクト作成時に自動生成されます)

この構造に慣れることで、Rでのデータ分析がよりスムーズで、管理しやすいものになります。