Last updated: October 2009. Kajiyama                    [ 目次に戻る ]

連続した数値データ「iris」をカテゴリ化する


  1. 使用する「iris」のデータ構造の確認

    (1)「irisデータ」のデータリスト

    ・「コンソール」 画面に,

    iris #  と記述すると,Rに組み込みこまれているFisherの研究で使われた「iris」データ 150サンプルが表示される.

    (2)「irisデータ」のデータ構造

    .「コンソール」 画面に,

    str (iris) #  と記述すると,「irisのデータ構造」が表示され,5変数の名前と,型が表示される.

    ・Sepal.Length: num 数値型  ・Sepal.Width : num 数値型  ・Petal.Length: num 数値型  ・Petal.Width : num 数値型
    ・Species  : Factor カテゴリ型

      あやめの大きな3枚のはなびらは,「Sepal がく片」で,小さな3枚のはなびらが,「Petal 花びら」である.

    Sepal「がく片」の長さと幅・Petal「花びら」の長さと幅

    Species「あやめ3品種 [setosa・versicolor・virginica]」

    > str(iris)

    'data.frame': 150 obs. of 5 variables:
    $ Sepal.Length: num 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ...
    $ Sepal.Width : num 3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ...
    $ Petal.Length: num 1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ...
    $ Petal.Width : num 0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 ...
    $ Species : Factor w/ 3 levels "setosa","versicolor",..: 1 1 1 1 1 1 1 1 1 ...


    (3) 「irisデータ」の基礎統計量

    「コンソール」 画面に,

    summary (iris) #  と記述すると,「irisデータの基礎統計量」が表示される.

    Min. 最小値, 1st Qu. 第1四分位, Median 中央値, Mean 平均値, 3rd Qu. 第3四分位, Max. 最大値.

    > summary (iris)

     Sepal.Length   Sepal.Width    Petal.Length    Petal.Width   Species
     Min.  :4.300   Min.  :2.000    Min.  :1.000   Min.  :0.100  setosa :50
     1st Qu.:5.100   1st Qu.:2.800    1st Qu.:1.600   1st Qu.:0.300  versicolor:50
     Mean :5.843   Mean :3.057    Mean :3.758   Mean :1.199   virginica:50
     3rd Qu.:6.400   3rd Qu.:3.300    3rd Qu.:5.100   3rd Qu.:1.800
     Max.  :7.900   Max.  :4.400   Max.  :6.900   Max.  :2.500



  2. 連続変数である「第1変数Sepal.Length」をカテゴリ化したデータを作成 

    第1〜4変数は長さや幅の連続した数値である.この連続した数値を分割点で区切り区間化しカテゴリに変換する.

    (1) 連続変数のカテゴリ化

    目的: 第1変数「Sepal.Length」は4.3〜7.9の値をとるので,これを1.0間隔で4区間に分割する.

    1.  4≦データ値<5
    2.  5≦データ値<6
    3.  6≦データ値<7
    4.  7≦データ値<8

    (2) 第1変数「Sepal.Length」を抜き出して,これをデータフレーム x とする.

    x <- iris $ Sepal.Length #  と記述すると,irisデータの第1列の「Sepal.Length」がxに抜き出される.

    x #  と記述し抜き出した150サンプルの「Sepal.Length」のデータxを確認する.

    > x <- iris $ Sepal.Length
    > x


    [1] 5.1 4.9 4.7 4.6 5.0 5.4 4.6 5.0 4.4 4.9 5.4 4.8 4.8 4.3 5.8 5.7 5.4 5.1 5.7 5.1 5.4 5.1 4.6 5.1 4.8 5.0 5.0
    [28] 5.2 5.2 4.7 4.8 5.4 5.2 5.5 4.9 5.0 5.5 4.9 4.4 5.1 5.0 4.5 4.4 5.0 5.1 4.8 5.1 4.6 5.3 5.0 7.0 6.4 6.9 5.5
    [55] 6.5 5.7 6.3 4.9 6.6 5.2 5.0 5.9 6.0 6.1 5.6 6.7 5.6 5.8 6.2 5.6 5.9 6.1 6.3 6.1 6.4 6.6 6.8 6.7 6.0 5.7 5.5
    [82] 5.5 5.8 6.0 5.4 6.0 6.7 6.3 5.6 5.5 5.5 6.1 5.8 5.0 5.6 5.7 5.7 6.2 5.1 5.7 6.3 5.8 7.1 6.3 6.5 7.6 4.9 7.3
    [109] 6.7 7.2 6.5 6.4 6.8 5.7 5.8 6.4 6.5 7.7 7.7 6.0 6.9 5.6 7.7 6.3 6.7 7.2 6.2 6.1 6.4 7.2 7.4 7.9 6.4 6.3 6.1
    [136] 7.7 6.3 6.4 6.0 6.9 6.7 6.9 5.8 6.8 6.7 6.7 6.3 6.5 6.2 5.9


    ・Rの中のデータの形式は,c(数値01,数値02,数値03,数値04,・・・・)の数値のベクトルである.「c関数」が用いられている.




    (3) 4〜8の間を5区間に分割しデータをカテゴリ化する.分類後のデータをデータフレーム x2 とする.

    x2 <- cut( x, breaks = c(4,5,6,7,8), labels= c("4-5","5-6","6-7","7-8"), right=FALSE, ordered_result=TRUE )

    #  と記述すると,連続した数値を区間ごとのカテゴリに変換する.分類したデータが x2 に保存される.

    ・right=FALSE は区間の下限の値は区間に含まれるが,上限の値は区間に含まれないことを示している.m≦データ値<n

    x2 #  と記述し分類後の150サンプルのデータx2を確認する.

    サンプル01の数値5.1がカテゴリ"5-6"に変換されていることがわかる.

    > x2 <- cut(x, breaks=c(3,4,5,6,7,8),labels=c("3-4","4-5","5-6","6-7","7-8"),right=FALSE,ordered_result=TRUE)
    > x2


    [1] 5-6 4-5 4-5 4-5 5-6 5-6 4-5 5-6 4-5 4-5 5-6 4-5 4-5 4-5 5-6 5-6 5-6 5-6 5-6 5-6 5-6 5-6 4-5 5-6 4-5 5-6 5-6
    [28] 5-6 5-6 4-5 4-5 5-6 5-6 5-6 4-5 5-6 5-6 4-5 4-5 5-6 5-6 4-5 4-5 5-6 5-6 4-5 5-6 4-5 5-6 5-6 7-8 6-7 6-7 5-6
    [55] 6-7 5-6 6-7 4-5 6-7 5-6 5-6 5-6 6-7 6-7 5-6 6-7 5-6 5-6 6-7 5-6 5-6 6-7 6-7 6-7 6-7 6-7 6-7 6-7 6-7 5-6 5-6
    [82] 5-6 5-6 6-7 5-6 6-7 6-7 6-7 5-6 5-6 5-6 6-7 5-6 5-6 5-6 5-6 5-6 6-7 5-6 5-6 6-7 5-6 7-8 6-7 6-7 7-8 4-5 7-8
    [109] 6-7 7-8 6-7 6-7 6-7 5-6 5-6 6-7 6-7 7-8 7-8 6-7 6-7 5-6 7-8 6-7 6-7 7-8 6-7 6-7 6-7 7-8 7-8 7-8 6-7 6-7 6-7
    [136] 7-8 6-7 6-7 6-7 6-7 6-7 6-7 5-6 6-7 6-7 6-7 6-7 6-7 6-7 5-6
    Levels: 4-5 < 5-6 < 6-7 < 7-8 #カテゴリは4タイプ


    ・Rの中のデータの形式は,c(文字01,文字02,文字03,文字04,・・・・)の文字のベクトルである.「c関数」が用いられている.

    ・分類結果の文字とそのラベル・意味が,2L=”5−6”のように記述されている..




    (4) データフレーム x2 の度数分布表を見る.

    table(x2) #  と記述すると,度数分布表が作成される.

    > table(x2)
    x2
     4-5  5-6  6-7  7-8
      22   61   54  13


  3. 連続変数「第2変数 Sepal.Width」をカテゴリ化したデータを作成 

    (1) 連続変数のカテゴリ化

    目的: 第2変数 Sepal.Widthは2.0〜4.4の値をとるので,これを0.5間隔で5区間に分割する.

    1. 2.0≦データ値<2.5
    2. 2.5≦データ値<3.0
    3. 3.0≦データ値<3.5
    4. 3.5≦データ値<4.0
    5. 4.0≦データ値<4.5

    (2) 第2変数 Sepal.Widthを抜き出して,これをデータフレーム y とする.

    y <- iris $ Sepal.Width #  と記述すると,irisデータの第2列の「Sepal.Width」がyに抜き出される.

    y #  と記述し抜き出した150サンプルの「Sepal.Width」のデータyを確認する.

    > y <- iris $ Sepal.Width

    > y

    [1] 3.5 3.0 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 3.7 3.4 3.0 3.0 4.0 4.4 3.9 3.5 3.8 3.8 3.4 3.7 3.6
    [24] 3.3 3.4 3.0 3.4 3.5 3.4 3.2 3.1 3.4 4.1 4.2 3.1 3.2 3.5 3.6 3.0 3.4 3.5 2.3 3.2 3.5 3.8 3.0
    [47] 3.8 3.2 3.7 3.3 3.2 3.2 3.1 2.3 2.8 2.8 3.3 2.4 2.9 2.7 2.0 3.0 2.2 2.9 2.9 3.1 3.0 2.7 2.2
    [70] 2.5 3.2 2.8 2.5 2.8 2.9 3.0 2.8 3.0 2.9 2.6 2.4 2.4 2.7 2.7 3.0 3.4 3.1 2.3 3.0 2.5 2.6 3.0
    [93] 2.6 2.3 2.7 3.0 2.9 2.9 2.5 2.8 3.3 2.7 3.0 2.9 3.0 3.0 2.5 2.9 2.5 3.6 3.2 2.7 3.0 2.5 2.8
    [116] 3.2 3.0 3.8 2.6 2.2 3.2 2.8 2.8 2.7 3.3 3.2 2.8 3.0 2.8 3.0 2.8 3.8 2.8 2.8 2.6 3.0 3.4 3.1
    [139] 3.0 3.1 3.1 3.1 2.7 3.2 3.3 3.0 2.5 3.0 3.4 3.0


    (3) 2.0〜4.4の間を5区間に分割しデータをカテゴリ化する.分類後のデータをデータフレーム y2 とする.

    y2 <- cut(y, breaks = c(2.0,2.5,3.0,3.5,4.0,4.5), labels= c("2.0-2.5","2.5-3.0","3.0-3.5","3.5-4.0","4.0-4.5"), right=FALSE, ordered_result=TRUE)

    と記述すると,連続した数値を区間ごとのカテゴリに変換する.分類したデータが y2 に保存される.

    ・right=FALSE は区間の下限の値は区間に含まれるが,上限の値は区間に含まれないことを示している.m≦データ値<n

    y2 #  と記述し分類後の150サンプルのデータy2を確認する.

    サンプル01の数値3.5がカテゴリ"3.5-4.0"に変換されていることがわかる.

    > y2 <- cut(y, breaks = c(2.0,2.5,3.0,3.5,4.0,4.5), labels= c("2.0-2.5","2.5-3.0","3.0-3.5","3.5-4.0","4.0-4.5"), right=FALSE, ordered_result=TRUE)

    > y2

    [1] 3.5-4.0 3.0-3.5 3.0-3.5 3.0-3.5 3.5-4.0 3.5-4.0 3.0-3.5 3.0-3.5 2.5-3.0 3.0-3.5 3.5-4.0
    [12] 3.0-3.5 3.0-3.5 3.0-3.5 4.0-4.5 4.0-4.5 3.5-4.0 3.5-4.0 3.5-4.0 3.5-4.0 3.0-3.5 3.5-4.0
    [23] 3.5-4.0 3.0-3.5 3.0-3.5 3.0-3.5 3.0-3.5 3.5-4.0 3.0-3.5 3.0-3.5 3.0-3.5 3.0-3.5 4.0-4.5
    [34] 4.0-4.5 3.0-3.5 3.0-3.5 3.5-4.0 3.5-4.0 3.0-3.5 3.0-3.5 3.5-4.0 2.0-2.5 3.0-3.5 3.5-4.0
    [45] 3.5-4.0 3.0-3.5 3.5-4.0 3.0-3.5 3.5-4.0 3.0-3.5 3.0-3.5 3.0-3.5 3.0-3.5 2.0-2.5 2.5-3.0
    [56] 2.5-3.0 3.0-3.5 2.0-2.5 2.5-3.0 2.5-3.0 2.0-2.5 3.0-3.5 2.0-2.5 2.5-3.0 2.5-3.0 3.0-3.5
    [67] 3.0-3.5 2.5-3.0 2.0-2.5 2.5-3.0 3.0-3.5 2.5-3.0 2.5-3.0 2.5-3.0 2.5-3.0 3.0-3.5 2.5-3.0
    [78] 3.0-3.5 2.5-3.0 2.5-3.0 2.0-2.5 2.0-2.5 2.5-3.0 2.5-3.0 3.0-3.5 3.0-3.5 3.0-3.5 2.0-2.5
    [89] 3.0-3.5 2.5-3.0 2.5-3.0 3.0-3.5 2.5-3.0 2.0-2.5 2.5-3.0 3.0-3.5 2.5-3.0 2.5-3.0 2.5-3.0
    [100] 2.5-3.0 3.0-3.5 2.5-3.0 3.0-3.5 2.5-3.0 3.0-3.5 3.0-3.5 2.5-3.0 2.5-3.0 2.5-3.0 3.5-4.0
    [111] 3.0-3.5 2.5-3.0 3.0-3.5 2.5-3.0 2.5-3.0 3.0-3.5 3.0-3.5 3.5-4.0 2.5-3.0 2.0-2.5 3.0-3.5
    [122] 2.5-3.0 2.5-3.0 2.5-3.0 3.0-3.5 3.0-3.5 2.5-3.0 3.0-3.5 2.5-3.0 3.0-3.5 2.5-3.0 3.5-4.0
    [133] 2.5-3.0 2.5-3.0 2.5-3.0 3.0-3.5 3.0-3.5 3.0-3.5 3.0-3.5 3.0-3.5 3.0-3.5 3.0-3.5 2.5-3.0
    [144] 3.0-3.5 3.0-3.5 3.0-3.5 2.5-3.0 3.0-3.5 3.0-3.5 3.0-3.5
    Levels: 2.0-2.5 < 2.5-3.0 < 3.0-3.5 < 3.5-4.0 < 4.0-4.5    #カテゴリは5タイプ


    (4) データフレーム y2 の度数分布表を見る.

    table(y2) #  と記述すると,度数分布表が作成される.

    > table(y2)
    y2
    2.0-2.5 2.5-3.0 3.0-3.5 3.5-4.0 4.0-4.5
      11    46    68   21     4


  4. 連続変数「第3変数 Petal.Length」をカテゴリ化したデータを作成 

    (1) 連続変数のカテゴリ化

    目的: 第3変数 Petal.Lengthは1.0〜6.9の値をとるので,これを2.0間隔で4区間に分割する.

    1. 0.0≦データ値<2.0
    2. 2.0≦データ値<4.0
    3. 4.0≦データ値<6.0
    4. 6.0≦データ値<8.0

    (2) 第3変数 Petal.Lengthを抜き出して,これをデータフレーム y とする.

    z <- iris $ Petal.Length #  と記述すると,irisデータの第3列の「Petal.Length」がzに抜き出される.

    z #  と記述し抜き出した150サンプルの「Petal.Length」のデータyを確認する.

    (3) 0.0〜8.0の間を4区間に分割しデータをカテゴリ化する.分類後のデータをデータフレーム z2 とする.

    z2 <- cut(z, breaks = c(0.0,2.0,4.0,6.0,8.0), labels= c("0.0-2.0","2.0-4.0","4.0-6.0","6.0-8.0"), right=FALSE, ordered_result=TRUE)

    #  と記述すると,連続した数値を区間ごとのカテゴリに変換する.分類したデータが z2 に保存される.

    ・right=FALSE は区間の下限の値は区間に含まれるが,上限の値は区間に含まれないことを示している.m≦データ値<n

    z2 #  と記述し分類後の150サンプルのデータz2を確認する.

    サンプル01の数値1.4がカテゴリ"0.0-2.0"に変換されていることがわかる.

    > z <- iris $ Petal.Length
    > z

    [1] 1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 1.5 1.6 1.4 1.1 1.2 1.5 1.3 1.4 1.7 1.5 1.7 1.5 1.0 1.7 1.9 1.6 1.6 1.5 1.4 1.6
    [31] 1.6 1.5 1.5 1.4 1.5 1.2 1.3 1.4 1.3 1.5 1.3 1.3 1.3 1.6 1.9 1.4 1.6 1.4 1.5 1.4 4.7 4.5 4.9 4.0 4.6 4.5 4.7 3.3 4.6 3.9
    [61] 3.5 4.2 4.0 4.7 3.6 4.4 4.5 4.1 4.5 3.9 4.8 4.0 4.9 4.7 4.3 4.4 4.8 5.0 4.5 3.5 3.8 3.7 3.9 5.1 4.5 4.5 4.7 4.4 4.1 4.0
    [91] 4.4 4.6 4.0 3.3 4.2 4.2 4.2 4.3 3.0 4.1 6.0 5.1 5.9 5.6 5.8 6.6 4.5 6.3 5.8 6.1 5.1 5.3 5.5 5.0 5.1 5.3 5.5 6.7 6.9 5.0
    [121] 5.7 4.9 6.7 4.9 5.7 6.0 4.8 4.9 5.6 5.8 6.1 6.4 5.6 5.1 5.6 6.1 5.6 5.5 4.8 5.4 5.6 5.1 5.1 5.9 5.7 5.2 5.0 5.2 5.4 5.1

    > z2 <- cut(z, breaks = c(0.0,2.0,4.0,6.0,8.0), labels= c("0.0-2.0","2.0-4.0","4.0-6.0","6.0-8.0"), right=FALSE, ordered_result=TRUE)
    > z2

    [1] 0.0-2.0 0.0-2.0 0.0-2.0 0.0-2.0 0.0-2.0 0.0-2.0 0.0-2.0 0.0-2.0 0.0-2.0 0.0-2.0 0.0-2.0 0.0-2.0 0.0-2.0 0.0-2.0 0.0-2.0
    [16] 0.0-2.0 0.0-2.0 0.0-2.0 0.0-2.0 0.0-2.0 0.0-2.0 0.0-2.0 0.0-2.0 0.0-2.0 0.0-2.0 0.0-2.0 0.0-2.0 0.0-2.0 0.0-2.0 0.0-2.0
    [31] 0.0-2.0 0.0-2.0 0.0-2.0 0.0-2.0 0.0-2.0 0.0-2.0 0.0-2.0 0.0-2.0 0.0-2.0 0.0-2.0 0.0-2.0 0.0-2.0 0.0-2.0 0.0-2.0 0.0-2.0
    [46] 0.0-2.0 0.0-2.0 0.0-2.0 0.0-2.0 0.0-2.0 4.0-6.0 4.0-6.0 4.0-6.0 4.0-6.0 4.0-6.0 4.0-6.0 4.0-6.0 2.0-4.0 4.0-6.0 2.0-4.0
    [61] 2.0-4.0 4.0-6.0 4.0-6.0 4.0-6.0 2.0-4.0 4.0-6.0 4.0-6.0 4.0-6.0 4.0-6.0 2.0-4.0 4.0-6.0 4.0-6.0 4.0-6.0 4.0-6.0 4.0-6.0
    [76] 4.0-6.0 4.0-6.0 4.0-6.0 4.0-6.0 2.0-4.0 2.0-4.0 2.0-4.0 2.0-4.0 4.0-6.0 4.0-6.0 4.0-6.0 4.0-6.0 4.0-6.0 4.0-6.0 4.0-6.0
    [91] 4.0-6.0 4.0-6.0 4.0-6.0 2.0-4.0 4.0-6.0 4.0-6.0 4.0-6.0 4.0-6.0 2.0-4.0 4.0-6.0 6.0-8.0 4.0-6.0 4.0-6.0 4.0-6.0 4.0-6.0
    [106] 6.0-8.0 4.0-6.0 6.0-8.0 4.0-6.0 6.0-8.0 4.0-6.0 4.0-6.0 4.0-6.0 4.0-6.0 4.0-6.0 4.0-6.0 4.0-6.0 6.0-8.0 6.0-8.0 4.0-6.0
    [121] 4.0-6.0 4.0-6.0 6.0-8.0 4.0-6.0 4.0-6.0 6.0-8.0 4.0-6.0 4.0-6.0 4.0-6.0 4.0-6.0 6.0-8.0 6.0-8.0 4.0-6.0 4.0-6.0 4.0-6.0
    [136] 6.0-8.0 4.0-6.0 4.0-6.0 4.0-6.0 4.0-6.0 4.0-6.0 4.0-6.0 4.0-6.0 4.0-6.0 4.0-6.0 4.0-6.0 4.0-6.0 4.0-6.0 4.0-6.0 4.0-6.0
    Levels: 0.0-2.0 < 2.0-4.0 < 4.0-6.0 < 6.0-8.0  #カテゴリは4タイプ


    (4) データフレーム z2 の度数分布表を見る.

    table(z2) #  と記述すると,度数分布表が作成される.

    > table(z2)
    z2
    0.0-2.0 2.0-4.0 4.0-6.0 6.0-8.0
       50   11    78   11


  5. 連続変数「第4変数 Petal.Width」をカテゴリ化したデータを作成 

    (1) 連続変数のカテゴリ化

    目的: 第4変数 Petal.Widthは0.1〜2.5の値をとるので,これを1.0間隔で3区間に分割する.

    1. 0.0≦データ値<1.0
    2. 1.0≦データ値<2.0
    3. 2.0≦データ値<3.0

    (2) 第4変数 Petal.Widthを抜き出して,これをデータフレーム y とする.

    w <- iris $ Petal.Width #  と記述すると,irisデータの第4列の「Petal.Width」がwに抜き出される.

    (3) 0.0〜3.0の間を3区間に分割しデータをカテゴリ化する.分類後のデータをデータフレーム w2 とする.

    w2 <- cut(w, breaks = c(0.0,1.0,2.0,3.0), labels= c("0.0-1.0","1.0-2.0","2.0-3.0"), right=FALSE, ordered_result=TRUE)

    #  と記述すると,連続した数値を区間ごとのカテゴリに変換する.分類したデータが w2 に保存される.

    w #  と記述し抜き出した150サンプルの「Petal.Width」のデータyを確認する.

    w2 #  と記述し分類後の150サンプルのデータw2を確認する.

    サンプル01の数値0.2がカテゴリ"0.0-1.0"に変換されていることがわかる.


    > w <- iris $ Petal.Width
    > w2 <- cut(w, breaks = c(0.0,1.0,2.0,3.0), labels= c("0.0-1.0","1.0-2.0","2.0-3.0"), right=FALSE, ordered_result=TRUE)
    > w


    [1] 0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 0.2 0.2 0.1 0.1 0.2 0.4 0.4 0.3 0.3 0.3 0.2 0.4 0.2 0.5 0.2 0.2 0.4 0.2 0.2 0.2
    [31] 0.2 0.4 0.1 0.2 0.2 0.2 0.2 0.1 0.2 0.2 0.3 0.3 0.2 0.6 0.4 0.3 0.2 0.2 0.2 0.2 1.4 1.5 1.5 1.3 1.5 1.3 1.6 1.0 1.3 1.4
    [61] 1.0 1.5 1.0 1.4 1.3 1.4 1.5 1.0 1.5 1.1 1.8 1.3 1.5 1.2 1.3 1.4 1.4 1.7 1.5 1.0 1.1 1.0 1.2 1.6 1.5 1.6 1.5 1.3 1.3 1.3
    [91] 1.2 1.4 1.2 1.0 1.3 1.2 1.3 1.3 1.1 1.3 2.5 1.9 2.1 1.8 2.2 2.1 1.7 1.8 1.8 2.5 2.0 1.9 2.1 2.0 2.4 2.3 1.8 2.2 2.3 1.5
    [121] 2.3 2.0 2.0 1.8 2.1 1.8 1.8 1.8 2.1 1.6 1.9 2.0 2.2 1.5 1.4 2.3 2.4 1.8 1.8 2.1 2.4 2.3 1.9 2.3 2.5 2.3 1.9 2.0 2.3 1.8
    > w2
    [1] 0.0-1.0 0.0-1.0 0.0-1.0 0.0-1.0 0.0-1.0 0.0-1.0 0.0-1.0 0.0-1.0 0.0-1.0 0.0-1.0 0.0-1.0 0.0-1.0 0.0-1.0 0.0-1.0 0.0-1.0
    [16] 0.0-1.0 0.0-1.0 0.0-1.0 0.0-1.0 0.0-1.0 0.0-1.0 0.0-1.0 0.0-1.0 0.0-1.0 0.0-1.0 0.0-1.0 0.0-1.0 0.0-1.0 0.0-1.0 0.0-1.0
    [31] 0.0-1.0 0.0-1.0 0.0-1.0 0.0-1.0 0.0-1.0 0.0-1.0 0.0-1.0 0.0-1.0 0.0-1.0 0.0-1.0 0.0-1.0 0.0-1.0 0.0-1.0 0.0-1.0 0.0-1.0
    [46] 0.0-1.0 0.0-1.0 0.0-1.0 0.0-1.0 0.0-1.0 1.0-2.0 1.0-2.0 1.0-2.0 1.0-2.0 1.0-2.0 1.0-2.0 1.0-2.0 1.0-2.0 1.0-2.0 1.0-2.0
    [61] 1.0-2.0 1.0-2.0 1.0-2.0 1.0-2.0 1.0-2.0 1.0-2.0 1.0-2.0 1.0-2.0 1.0-2.0 1.0-2.0 1.0-2.0 1.0-2.0 1.0-2.0 1.0-2.0 1.0-2.0
    [76] 1.0-2.0 1.0-2.0 1.0-2.0 1.0-2.0 1.0-2.0 1.0-2.0 1.0-2.0 1.0-2.0 1.0-2.0 1.0-2.0 1.0-2.0 1.0-2.0 1.0-2.0 1.0-2.0 1.0-2.0
    [91] 1.0-2.0 1.0-2.0 1.0-2.0 1.0-2.0 1.0-2.0 1.0-2.0 1.0-2.0 1.0-2.0 1.0-2.0 1.0-2.0 2.0-3.0 1.0-2.0 2.0-3.0 1.0-2.0 2.0-3.0
    [106] 2.0-3.0 1.0-2.0 1.0-2.0 1.0-2.0 2.0-3.0 2.0-3.0 1.0-2.0 2.0-3.0 2.0-3.0 2.0-3.0 2.0-3.0 1.0-2.0 2.0-3.0 2.0-3.0 1.0-2.0
    [121] 2.0-3.0 2.0-3.0 2.0-3.0 1.0-2.0 2.0-3.0 1.0-2.0 1.0-2.0 1.0-2.0 2.0-3.0 1.0-2.0 1.0-2.0 2.0-3.0 2.0-3.0 1.0-2.0 1.0-2.0
    [136] 2.0-3.0 2.0-3.0 1.0-2.0 1.0-2.0 2.0-3.0 2.0-3.0 2.0-3.0 1.0-2.0 2.0-3.0 2.0-3.0 2.0-3.0 1.0-2.0 2.0-3.0 2.0-3.0 1.0-2.0
    Levels: 0.0-1.0 < 1.0-2.0 < 2.0-3.0  #カテゴリは4タイプ


    (4) データフレーム w2 の度数分布表を見る.

    table(w2) #  と記述すると,度数分布表が作成される.

    > table(w2)
    w2
    0.0-1.0 1.0-2.0 2.0-3.0
       50   71    29

[ 目次に戻る ]