Last updated: October 2008. Kajiyama                    [ 目次に戻る ]

2変数の散布図を作成


  1. 2変数の関係

    ・変数Aの数値の高いほど変数Bの数値が高くなるというような,量的な2変数の関係を「相関」という.

    ・これに対し質的な2変数の関係を「連関」という.


  2. 散布図のコマンド plot

    plot ( データ名 ) # 全変数間の散布図を作図する

    plot ( データ名[ 1 : 4 ] ) # 変数1 〜 4の間の散布図を作図する

    plot ( 変数名m ~ 変数名n, data=データ名 ) # 変数名m X 変数名n の散布図を作図する

    plot( データ名 [,1], データ名 [,3] ) #第1変数[,1]と第3変数[,3]の散布図を作図する


  3. 使用する「iris」150サンプル データの表示とデータ構造の確認

    ・「コンソール」 画面に,

    str (iris) #  と記述すると,「irisのデータ構造」が表示され,5変数の名前と,型が表示される.

    
    > str(iris)
    'data.frame':   150 obs. of  5 variables:
     $ Sepal.Length:  num  5.1 4.9 4.7 4.6 5   5.4 4.6 5   4.4 4.9 ...
     $ Sepal.Width :  num  3.5 3   3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ...
     $ Petal.Length:  num  1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ...
     $ Petal.Width :  num  0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 ...
     $ Species     :  Factor w/ 3 levels "setosa","versicolor",..: 1 1 1 1 1 1 1 1 1 ...
    

    ・Sepal.Length: num数値型 ・Sepal.Width : num数値型 ・Petal.Length: num数値型 ・Petal.Width : num数値型  ・Species: Factor因子型

      あやめの大きな3枚のはなびらは,「Sepal がく片」で,小さな3枚のはなびらが,「Petal 花びら」である.

    Sepal「がく片」の長さと幅・Petal「花びら」の長さと幅

    Species「あやめ3品種 [setosa・versicolor・virginica]」

  4. 「irisデータ」の5変数間の散布図の作図

    (1)「コンソール」 画面に,

    plot ( iris ) #  横軸第1変数[,1]〜第5変数[,5]の間の散布図を作図する

    # と記述すると,「irisデータ」の5変数間の散布図が同時に表示される.


    (2)「コンソール」 画面に,

    pairs ( iris [1:4] ) #  横軸第1変数[,1]〜第4変数[,4]の間の散布図を作図する

    # と記述すると,「irisデータ」の4変数間の散布図が同時に表示される.


    (3)「コンソール」 画面に,

    pairs(iris[1:4], main = "Iris Data setosa/versicolor/virginica", pch = 21, bg = c("red", "green3", "blue")[unclass(iris$Species)])

    # と記述すると,「irisデータ」の種別に色分けした4変数間の散布図が同時に表示される.

    ・参照 グラフィックス参考実例集:散布図行列 -RjpWiki

    (4)散布図・画像の保存は,「ファイル」−>「別名で保存」−>「Png」あるいは「Jpeg」」で保存する.


  5. 「irisデータ」の「がく片の長さ」と「花びらの長さ」散布図の作図

    (1)「コンソール」 画面に,

    plot ( Petal.Length ~ Sepal.Length, data=iris ) #  縦軸第3変数[Petal.Length]と横軸第1変数[Sepal.Length]の散布図を作図する

    # と記述すると,「irisデータ」の第1変数「がく片の長さ」と第3変数「花びらの長さ」の散布図が表示される.


    > (2)「コンソール」 画面に,

    plot ( iris [,1], iris [,3] ) #  横軸第1変数[,1]と縦軸第3変数[,3]の散布図を作図する

    # と記述すると,「irisデータ」の第1変数と第3変数の散布図が表示される.

    (3)「irisデータ」のサンプル番号付の散布図の作図

    「コンソール」 画面に,

    plot ( iris [,1], iris [,3], type="n" ) #  横軸第1変数[,1]と縦軸第3変数[,3]の散布図を作図する

    text ( iris [,1], iris [,3] ) #  番号の散布図を作図する

    # と記述すると,「irisデータ」の第1変数と第3変数の散布図が表示される.


    (4)「irisデータ」の記号付きの散布図の作図

    次に「コンソール」 画面に,

    label <- rep(c("せ","べ","ば"),rep(50,3)) #  種類ごとに50x3のラベルデータを作る

    plot ( iris [,1], iris [,3], type="n" )

    text ( iris [,1], iris [,3], label ) #  ラベルのデータで文字入れする.

    # と記述すると,「irisデータ」の第1変数と第3変数の散布図が表示される.


    (5)種類別の「irisデータ」の色付きの散布図の作図

    「コンソール」 画面に,

    plot( iris$Sepal.Length, iris$Petal.Length, pch = 21, bg = c("red", "green3", "blue") [unclass ( iris$Species ) ] )

    #  と記述すると,「irisデータ」の第1変数と第3変数の散布図が表示される.


[ 目次に戻る ]