Last updated: October 2008. Kajiyama                    [ 目次に戻る ]

データフレームとは


  1. 「Rでデータ解析する」ためのデータの構造を「データフレーム」という.


    1. 言い換えると,データを読み込み,統計の関数を利用してデータ解析するには,

      Rで使用するデータは「データフレーム」の形式
      でなければならない.

    2. コンピュータは教師と違って融通が利かないので,コンピュータとの以下の約束事を守るように.


    3. データは,行と列で構成し,行はサンプル,列はサンプルの変数を表す.

    4. データの第1行は,必ず,変数名のリストにする.

    5. 表のグリーンの部分が,「Rのデータフレーム」であり,行と列の表形式で,行にはサンプル(観測値)が並び,列にはその変数が並ぶ.

    6. 縦の列ごとに変数(項目あるいはアイテム)の値が並び,変数ごとに値は「数値」型と「文字列」型,「カテゴリ」型が扱える.


    7. Rのデータフレームとしてよみこまれると,「サンプル番号」は自動的につけられ,サンプルの値とはみなさない.

    8. 行列に空欄は作らない.データフレームの変数の値が空白では,Rはこれを読み込まない.

      この「欠損値」には, Rでは NA を入れる.Not Availableの略である.



     表  汎用のデータ形式

    サンプル
    番号
     変数01
    (ver01)
     変数02
    (ver02)
     変数03
    (ver03)
     変数04
    (ver04)
     変数05
    (ver05)
     変数06
    (ver06)
     変数07
    (ver07)
     変数08
    (ver08)
     変数09
    (ver09)
     変数10
    (ver10)
    1 1 2 3 4 5 6 7 8 9 10
    2 11 12 13 14 15 16 17 18 19 20
    3 21 22   NA 25 26 27 28 29 30
    4 31 32   NA 35 36 37 38 39 40
    5 41 42   NA 45 46 47 48 49 50
    6 51 52 53 NA 55 56 57 58 59 60
    7 61 62 63 64 65 66 67 68 69 70
    8 71 72 73 74 75 76 77 78 79 80
    9 81 82 83 84 85 86 87 88 89 90



     表  クロス集計表 (分割表あるいはクロス表)のデータ形式

      変数01-カテゴリ01
    (ver01)
    変数01-カテゴリ02
    (ver02)
    変数01-カテゴリ03
    (ver03)
     1    (実験群    01) 1 2 3
     2    (実験群    02) 4 5 6
     3    (対照群    01) 7 8 9


      変数01-カテゴリ01
    (ver01)
    変数01-カテゴリ02
    (ver02)
    変数01-カテゴリ03
    (ver03)
     1  (変数02-カテゴリ01) 1 2 3
     2  (変数02-カテゴリ02) 4 5 6
     3  (変数02-カテゴリ03) 7 8 9



  2. Rで扱うデータフレームの表現形式 「スタック形式」・「アンスタック形式」


    統計に用いる関数が要求するデータフレームの表現形式は,下の表に示す「アンスタック形式」と「スタック形式」がある.

    変数ごとに列として整理した表形式の「アンスタック形式」とデータを一列にまとめた「スタック形式」である.

    データの情報は同じなので2つの形式は stack 関数と unstack 関数で互いにデータ変換できる.

    表 「アンスタック形式」unstack 表 「スタック形式」stack
    実験群 対照群
    10 9
    9 10
    9 8
    9 10
    7 8
    8 7
    6 7
    7 5
    5 7
    測定値
    10 実験群
    9 実験群
    9 実験群
    9 実験群
    7 実験群
    8 実験群
    6 実験群
    7 実験群
    5 実験群
    9 対照群
    10 対照群
    8 対照群
    10 対照群
    8 対照群
    7 対照群
    7 対照群
    5 対照群
    7 対照群

[ 目次に戻る ]