Last updated: October 2009. Kajiyama                    [ 目次に戻る ]

「iris」の群・要因の水準ごとのサンプルを抽出する


  1.  使用する「iris」のデータ構造の確認

    (1) 「irisデータ」のデータ構造

    .「コンソール」 画面に,

    str (iris) #  と記述すると,「irisのデータ構造」が表示され,5変数の名前と,型が表示される.

    ・Sepal.Length: num 数値型  ・Sepal.Width : num 数値型  ・Petal.Length: num 数値型  ・Petal.Width : num 数値型
    ・Species  : Factor カテゴリ型

      あやめの大きな3枚のはなびらは,「Sepal がく片」で,小さな3枚のはなびらが,「Petal 花びら」である.

    Sepal「がく片」の長さと幅・Petal「花びら」の長さと幅

    Species「あやめ3品種 [setosa・versicolor・virginica]」

    
    > str(iris)
    'data.frame':   150 obs. of  5 variables:
     $ Sepal.Length: num  5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ...
     $ Sepal.Width : num  3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ...
     $ Petal.Length: num  1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ...
     $ Petal.Width : num  0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 ...
     $ Species     : Factor w/ 3 levels "setosa","versicolor",..: 1 1 1 1 1 1 1 1 1 1 ...
    


    (2) 「irisデータ」のデータリスト

    ・「コンソール」 画面に,

    iris #  と記述すると,Rに組み込みこまれているFisherの研究で使われた「iris」データ 150サンプルが表示される.

    
    > iris
        Sepal.Length Sepal.Width Petal.Length Petal.Width    Species
    1            5.1         3.5          1.4         0.2     setosa
    2            4.9         3.0          1.4         0.2     setosa
    3            4.7         3.2          1.3         0.2     setosa
    4            4.6         3.1          1.5         0.2     setosa
    5            5.0         3.6          1.4         0.2     setosa
    6            5.4         3.9          1.7         0.4     setosa
    7            4.6         3.4          1.4         0.3     setosa
    8            5.0         3.4          1.5         0.2     setosa
    9            4.4         2.9          1.4         0.2     setosa
    10           4.9         3.1          1.5         0.1     setosa
    11           5.4         3.7          1.5         0.2     setosa
    12           4.8         3.4          1.6         0.2     setosa
    13           4.8         3.0          1.4         0.1     setosa
    14           4.3         3.0          1.1         0.1     setosa
    15           5.8         4.0          1.2         0.2     setosa
    16           5.7         4.4          1.5         0.4     setosa
    17           5.4         3.9          1.3         0.4     setosa
    18           5.1         3.5          1.4         0.3     setosa
    19           5.7         3.8          1.7         0.3     setosa
        ・・・・・・・・・・・・・・・・・・・・・
    
    
        ・・・・・・・・・・・・・・・・・・・・・
        ・・・・・・・・・・・・・・・・・・・・・
    131          7.4         2.8          6.1         1.9  virginica
    132          7.9         3.8          6.4         2.0  virginica
    133          6.4         2.8          5.6         2.2  virginica
    134          6.3         2.8          5.1         1.5  virginica
    135          6.1         2.6          5.6         1.4  virginica
    136          7.7         3.0          6.1         2.3  virginica
    137          6.3         3.4          5.6         2.4  virginica
    138          6.4         3.1          5.5         1.8  virginica
    139          6.0         3.0          4.8         1.8  virginica
    140          6.9         3.1          5.4         2.1  virginica
    141          6.7         3.1          5.6         2.4  virginica
    142          6.9         3.1          5.1         2.3  virginica
    143          5.8         2.7          5.1         1.9  virginica
    144          6.8         3.2          5.9         2.3  virginica
    145          6.7         3.3          5.7         2.5  virginica
    146          6.7         3.0          5.2         2.3  virginica
    147          6.3         2.5          5.0         1.9  virginica
    148          6.5         3.0          5.2         2.0  virginica
    149          6.2         3.4          5.4         2.3  virginica
    150          5.9         3.0          5.1         1.8  virginica
    

    サンプル番号1−50が品種setosa,サンプル番号51−100が品種versicolor,サンプル番号101−150が品種virginicaである.



  2.  品種ごとにサンプルを抽出して「リスト」と「データフレーム」を作成する 「リスト」は「データフレーム」ではない

    「iris」データフレームにはSpecies変数に3品種のカテゴリーがある.カテゴリーごとにデータを抽出する.


    (1) 1変数のカテゴリー別に抽出しリストを作成

    「コンソール」 画面に,

    x1 <- split ( iris, iris$Species) #  と記述すると,3品種に分割したリストが x1 で新たに保存される.

    x1 #  と記述し,リスト x1 を確認する. $カテゴリー名ごとにリストが作成される.



    (2) 2変数以上のカテゴリー別に抽出しリストを作成するには

    「コンソール」 画面に,

    x2 <- split ( データフレーム名, list ( 変数1, 変数2, 変数3 ) ) #  と記述する.変数は因子型である.


    (3) このリストを使用してカテゴリーごとのデータフレームを作成

    「コンソール」 画面に,

    x1.setosa <- x1$setosa #  と記述すると,品種setosaのデータが x1.setosa名で新たに保存される.

    x1.setosa #  と記述し,データフレーム x1.setosaのリストを確認する.


    x1.versicolor <- x1$versicolor #  と記述すると,品種versicolorのデータが x1.versicolor名で新たに保存される.

    x1.versicolor #  と記述し,データフレーム x1.versicolorのリストを確認する.


    x1.virginica <- x1$virginica #  と記述すると,品種virginicaのデータが x1.virginica名で新たに保存される.

    x1.virginica #  と記述し,データフレーム x1.virginicaのリストを確認する.

    
    > x1 <- split ( iris, iris$Species)
    > x1
    
    $setosa
       Sepal.Length Sepal.Width Petal.Length Petal.Width Species
    1           5.1         3.5          1.4         0.2  setosa
    2           4.9         3.0          1.4         0.2  setosa
    3           4.7         3.2          1.3         0.2  setosa
    4           4.6         3.1          1.5         0.2  setosa
    5           5.0         3.6          1.4         0.2  setosa
        ・・・・・・・・・・・・・・・・・・・・・
    45          5.1         3.8          1.9         0.4  setosa
    46          4.8         3.0          1.4         0.3  setosa
    47          5.1         3.8          1.6         0.2  setosa
    48          4.6         3.2          1.4         0.2  setosa
    49          5.3         3.7          1.5         0.2  setosa
    50          5.0         3.3          1.4         0.2  setosa
    
    
    $versicolor
        Sepal.Length Sepal.Width Petal.Length Petal.Width    Species
    51           7.0         3.2          4.7         1.4 versicolor
    52           6.4         3.2          4.5         1.5 versicolor
    53           6.9         3.1          4.9         1.5 versicolor
    54           5.5         2.3          4.0         1.3 versicolor
    55           6.5         2.8          4.6         1.5 versicolor
    56           5.7         2.8          4.5         1.3 versicolor
        ・・・・・・・・・・・・・・・・・・・・・
    95           5.6         2.7          4.2         1.3 versicolor
    96           5.7         3.0          4.2         1.2 versicolor
    97           5.7         2.9          4.2         1.3 versicolor
    98           6.2         2.9          4.3         1.3 versicolor
    99           5.1         2.5          3.0         1.1 versicolor
    100          5.7         2.8          4.1         1.3 versicolor
    
    
    $virginica
        Sepal.Length Sepal.Width Petal.Length Petal.Width   Species
    101          6.3         3.3          6.0         2.5 virginica
    102          5.8         2.7          5.1         1.9 virginica
    103          7.1         3.0          5.9         2.1 virginica
    104          6.3         2.9          5.6         1.8 virginica
    105          6.5         3.0          5.8         2.2 virginica
    106          7.6         3.0          6.6         2.1 virginica
        ・・・・・・・・・・・・・・・・・・・・・
    146          6.7         3.0          5.2         2.3 virginica
    147          6.3         2.5          5.0         1.9 virginica
    148          6.5         3.0          5.2         2.0 virginica
    149          6.2         3.4          5.4         2.3 virginica
    150          5.9         3.0          5.1         1.8 virginica
    
    
    > x1.setosa <- x1$setosa 
    > x1.setosa    
       Sepal.Length Sepal.Width Petal.Length Petal.Width Species
    1           5.1         3.5          1.4         0.2  setosa
    2           4.9         3.0          1.4         0.2  setosa
    3           4.7         3.2          1.3         0.2  setosa
    4           4.6         3.1          1.5         0.2  setosa
    5           5.0         3.6          1.4         0.2  setosa
    6           5.4         3.9          1.7         0.4  setosa
        ・・・・・・・・・・・・・・・・・・・・・
    45          5.1         3.8          1.9         0.4  setosa
    46          4.8         3.0          1.4         0.3  setosa
    47          5.1         3.8          1.6         0.2  setosa
    48          4.6         3.2          1.4         0.2  setosa
    49          5.3         3.7          1.5         0.2  setosa
    50          5.0         3.3          1.4         0.2  setosa
    
    > x1.versicolor <- x1$versicolor 
    > x1.versicolor    
        Sepal.Length Sepal.Width Petal.Length Petal.Width    Species
    51           7.0         3.2          4.7         1.4 versicolor
    52           6.4         3.2          4.5         1.5 versicolor
    53           6.9         3.1          4.9         1.5 versicolor
    54           5.5         2.3          4.0         1.3 versicolor
    55           6.5         2.8          4.6         1.5 versicolor
    56           5.7         2.8          4.5         1.3 versicolor
        ・・・・・・・・・・・・・・・・・・・・・
    95           5.6         2.7          4.2         1.3 versicolor
    96           5.7         3.0          4.2         1.2 versicolor
    97           5.7         2.9          4.2         1.3 versicolor
    98           6.2         2.9          4.3         1.3 versicolor
    99           5.1         2.5          3.0         1.1 versicolor
    100          5.7         2.8          4.1         1.3 versicolor
    
    > x1.virginica <- x1$virginica 
    > x1.virginica    
        Sepal.Length Sepal.Width Petal.Length Petal.Width   Species
    101          6.3         3.3          6.0         2.5 virginica
    102          5.8         2.7          5.1         1.9 virginica
    103          7.1         3.0          5.9         2.1 virginica
    104          6.3         2.9          5.6         1.8 virginica
    105          6.5         3.0          5.8         2.2 virginica
    106          7.6         3.0          6.6         2.1 virginica
        ・・・・・・・・・・・・・・・・・・・・・
    145          6.7         3.3          5.7         2.5 virginica
    146          6.7         3.0          5.2         2.3 virginica
    147          6.3         2.5          5.0         1.9 virginica
    148          6.5         3.0          5.2         2.0 virginica
    149          6.2         3.4          5.4         2.3 virginica
    150          5.9         3.0          5.1         1.8 virginica
    


  3.  このデータフレームを使用して群・要因の水準ごとの基礎統計を算出する

    「コンソール」 画面に,

    summary ( x1.setosa ) #  と記述すると,品種setosaのデータの基礎統計量が計算される.

    summary ( x1.versicolor ) #  と記述すると,品種versicolorのデータの基礎統計量が計算される.

    summary ( x1.virginica ) #  と記述すると,品種virginicaのデータの基礎統計量が計算される.


    
    > summary ( x1.setosa )
      Sepal.Length    Sepal.Width     Petal.Length    Petal.Width          Species  
     Min.   :4.300   Min.   :2.300   Min.   :1.000   Min.   :0.100   setosa    :50  
     1st Qu.:4.800   1st Qu.:3.200   1st Qu.:1.400   1st Qu.:0.200   versicolor: 0  
     Median :5.000   Median :3.400   Median :1.500   Median :0.200   virginica : 0  
     Mean   :5.006   Mean   :3.428   Mean   :1.462   Mean   :0.246                  
     3rd Qu.:5.200   3rd Qu.:3.675   3rd Qu.:1.575   3rd Qu.:0.300                  
     Max.   :5.800   Max.   :4.400   Max.   :1.900   Max.   :0.600                  
    
    > summary ( x1.versicolor )
      Sepal.Length    Sepal.Width     Petal.Length   Petal.Width          Species  
     Min.   :4.900   Min.   :2.000   Min.   :3.00   Min.   :1.000   setosa    : 0  
     1st Qu.:5.600   1st Qu.:2.525   1st Qu.:4.00   1st Qu.:1.200   versicolor:50  
     Median :5.900   Median :2.800   Median :4.35   Median :1.300   virginica : 0  
     Mean   :5.936   Mean   :2.770   Mean   :4.26   Mean   :1.326                  
     3rd Qu.:6.300   3rd Qu.:3.000   3rd Qu.:4.60   3rd Qu.:1.500                  
     Max.   :7.000   Max.   :3.400   Max.   :5.10   Max.   :1.800                  
    
    > summary ( x1.virginica )
      Sepal.Length    Sepal.Width     Petal.Length    Petal.Width          Species  
     Min.   :4.900   Min.   :2.200   Min.   :4.500   Min.   :1.400   setosa    : 0  
     1st Qu.:6.225   1st Qu.:2.800   1st Qu.:5.100   1st Qu.:1.800   versicolor: 0  
     Median :6.500   Median :3.000   Median :5.550   Median :2.000   virginica :50  
     Mean   :6.588   Mean   :2.974   Mean   :5.552   Mean   :2.026                  
     3rd Qu.:6.900   3rd Qu.:3.175   3rd Qu.:5.875   3rd Qu.:2.300                  
     Max.   :7.900   Max.   :3.800   Max.   :6.900   Max.   :2.500
    



    by ( iris[1:4], iris $ Species, summary ) #  と記述しても3品種のカテゴリーごとに統計量を計算する.試してみる.

    
    > by ( iris[1:4], iris $ Species, summary ) 
    iris$Species: setosa
      Sepal.Length    Sepal.Width     Petal.Length    Petal.Width   
     Min.   :4.300   Min.   :2.300   Min.   :1.000   Min.   :0.100  
     1st Qu.:4.800   1st Qu.:3.200   1st Qu.:1.400   1st Qu.:0.200  
     Median :5.000   Median :3.400   Median :1.500   Median :0.200  
     Mean   :5.006   Mean   :3.428   Mean   :1.462   Mean   :0.246  
     3rd Qu.:5.200   3rd Qu.:3.675   3rd Qu.:1.575   3rd Qu.:0.300  
     Max.   :5.800   Max.   :4.400   Max.   :1.900   Max.   :0.600  
    -------------------------------------------------------------- 
    iris$Species: versicolor
      Sepal.Length    Sepal.Width     Petal.Length   Petal.Width   
     Min.   :4.900   Min.   :2.000   Min.   :3.00   Min.   :1.000  
     1st Qu.:5.600   1st Qu.:2.525   1st Qu.:4.00   1st Qu.:1.200  
     Median :5.900   Median :2.800   Median :4.35   Median :1.300  
     Mean   :5.936   Mean   :2.770   Mean   :4.26   Mean   :1.326  
     3rd Qu.:6.300   3rd Qu.:3.000   3rd Qu.:4.60   3rd Qu.:1.500  
     Max.   :7.000   Max.   :3.400   Max.   :5.10   Max.   :1.800  
    -------------------------------------------------------------- 
    iris$Species: virginica
      Sepal.Length    Sepal.Width     Petal.Length    Petal.Width   
     Min.   :4.900   Min.   :2.200   Min.   :4.500   Min.   :1.400  
     1st Qu.:6.225   1st Qu.:2.800   1st Qu.:5.100   1st Qu.:1.800  
     Median :6.500   Median :3.000   Median :5.550   Median :2.000  
     Mean   :6.588   Mean   :2.974   Mean   :5.552   Mean   :2.026  
     3rd Qu.:6.900   3rd Qu.:3.175   3rd Qu.:5.875   3rd Qu.:2.300  
     Max.   :7.900   Max.   :3.800   Max.   :6.900   Max.   :2.500
    

[ 目次に戻る ]