Last updated: October 2008. Kajiyama                    [ 目次に戻る ]

測定と尺度の考え方   Measurement and scale


  1. 情報とデータ

    定食屋の前でステーキ定食を食べたいと思ったら,この欲望を解決するために食事するための情報を集めなければならない.

    窓の外から眺めて空席は有るか無いか.財布にお金はいくらあるか.知り合いはいるかいないか.このように情報を集めて目に見えるデータ(data)にする.

    空席である,知り合いはいない,そしてお金が少なければ今日はハムカツ定食だなと,行動の目的を変更する.

    統計処理を行うときも食事と同じで,課題の情報をデータにすることから始まる.


  2. 変数と測定値

    あなたの体重は年齢により,季節によりさまざまな数値をとる.このように観察すればさまざまな値をとるものを変数(variable)という.

    あなたの性別は,男と女の2カテゴリで丁寧に観察すればどちらかと区別できるのでこれも変数である.

    これに対し,値が常に一定なものを定数(constant)と呼び区別する.

    観測して得られた数値(私の体重は42kg)やカテゴリ(あなたの性別は女)を,測定値(measured value)という.


  3. 測定と尺度

    人間や物,出来事(事象)の観測対象が持つある特性や属性を調べ値を得ることを測定(measurement)という.

    調べたい対象の特性や属性が統計上の変数であり,観測対象の変数は1個でも数十個でもよい.

    観測対象が持つ変数を決め,これをある尺度(巻尺・体重計や肌色見本)を使って計測し測定値を得る.

    データ処理を行うために,数値でない文字の測定値も数値化する.たとえば性別では女を1,男を2と数値のラベルを付ける.

    この対象の変数を数値化する規則が尺度(scale)であり,統計処理上は,以下に述べる4つの抽象的な尺度水準を区別する.


  4. 質的データと量的データ

    統計データは,質的データ(qualitative data)と量的データ(quantitative data)を区別する.

    (1) 質的データは,男女の性別,賭け事の好き嫌い,好きな音楽の種類(演歌,Jポップス,謡曲) などの数量として表現できないものである.

    これらの種類や内容を区別するために分類したデータであり,この分類のまとまりをカテゴリ(category)と呼び.カテゴリデータ・属性データとも呼ばれる.

    質的データは,名義尺度(性別,職業,目の色,音楽の種類)を持つものと順序の尺度(学歴,健康状態,好き嫌いの強さ)を持つものに分類できる.

    (2) 量的データは,身長,体重,歩幅,体温,所持金,あなたのこの科目のテストの点数,バイトの月収などの数量で表現できるものである.

    量的データは,間隔尺度(℃や華氏の温度,西暦の年数)と比例尺度(絶対温度,身長,体重,100m走の時間)


  5. 拡散変量と連続変量

    1つのサンプルについて測定した情報をまとめて変量と呼ぶ.変量は拡散変量(discrete variable)と連続変量(continuous variable)を区別する.

    (1) 拡散変量 変量が,1,2,3,4,5,のように,飛び飛びの値しかとらないものである.計数データとも呼ぶ.

    りんごの数,サイコロの目,家族数4人,人口1,255,632人,今日の殺人事件数0件 がこれに当てはまる.

    データの上では家族数3.2人はありえても,3.2人の家族は存在しない.サイコロの目は2の目と3の目の間に2.6の目はない.

    質的データは拡散変量で扱う.男,女はその中間がない.

    「グラフ」 順序づけのない離散変数のグラフは,隙間をあけた棒グラフで表す.順序づけのある離散変数のグラフは,ヒストグラムで表す.

    (2) 連続変量 変量が,連続の値をとるものである.計量データとも呼ぶ.

    りんごジュース250ml,身長185.6cm,体重72.3kg,モヤシの長さ15.7cm,温度35.7℃ がこれに当てはまる.

    身長を測るとき,cmやmmで値を丸めることがあるが,これは無視する.


  6. 尺度水準(尺度の種類)

    尺度は,先ほど述べたように,測っているものと数値との間の関係あるいは規則である.

    長さがなければ0m,子午線の4000万分の一長さを1mとする規則を定めて,我々はm尺度を使用している.

    次の4種類の尺度を区別する.

    (1) 名義尺度(nominal scale) 性別,国籍,野球選手の背番号,品物の品番,図書分類番号,音楽の種類 カテゴリデータ(categorical data)とも呼ぶ.

    性別で女を1,男を2と数値のラベルを付けるが,女性が一番,男性が二番の意味はない.数値には意味がない.

    (2) 順序尺度(ordinal scale) 学校の成績,ミスユニバースの成績,柔道の段位,将棋の段位

    100点の学生は50点の学生の2人分の学力があるとは考えない.学校の成績で91点と90点の1点差と60点と59点の1点差の学力差は同じではない.

    (3) 間隔尺度(interval scale) 摂氏氏華氏の温度,西暦,標準得点.

    100℃の水と10℃の水を足しても110℃の温度にならない.

    (4) 比例尺度(・比尺度・比率尺度ratio scale)  長さ,重さ,時間,物理量の測定.

    原点が定められており,四則演算ができる.50Kgの人が2kgの肉を食べれば52kgになる.

[ 目次に戻る ]