度数分布表
ヒストグラム
・尺度
名義尺度
順序尺度
比例尺度
・分散
分散s**2 = (1/n)*[(x1 – x)**2 + (x2-x)**2 + ・・・ + (xn-x)**2]
データの散らばり。
二乗することで +と-の場合分けをしなくても良い。
二乗することで遠くの離れた値をさらに離すことが平均との相性が良い
記述統計ではnで割るが、推測統計ではn-1で割る(不偏分散)
・標準偏差s
分散の平方根
・標準化得点x = = (xi – x)/s
平均を引くことで中心を0に統一する
標準偏差sで割ることでばらつき具合を統一する
平均と標準偏差が異なる別々の変数を平均0,標準偏差1に統一して比較できるようになる。
・変動係数CV = 標準偏差÷平均
平均に対するばらつき具合を見ることで単位などがことなる別々の変数間でも比較できるようになる。
・順序統計量
最小値
第一四分位数:小さい方から25%の値
中央値:小さい方から50%の値
第三四分位数:小さい方から75%の値
最大値
順序統計量は分布の特徴を順位の観点で考えるための値。
偏りがある分布では平均よりも中央値を見る方が分布を把握しやすい
・箱ひげ図
順序統計量を視覚化した図。
箱の中の線が中央値
箱の下端が第一四分位数、上端が第三四分位数
箱の上側のひげ:第三四分位数+四分位範囲*1.5の値
箱の下側のひげ:第一四分位数-四分位範囲*1.5の値
外れ値の点:ひげの中に収まらない値(第一、第三四分位数から1.5倍以上離れた値)
・範囲 =最大値 – 最小値
・四分位範囲 = 第三四分位数の値 – 第一四分位数の値
・散布図
2つの変数のばらつき方と相関関係を示す。
散布図内のある範囲の面積は共分散を示す。
・共分散(1/n)×Σ(xi-x)(yi-y) = (xの偏差×yの偏差の和)÷n
※(xi-x)(yi-y)は散布図上の四角形にになる
・相関係数 Rxy = Sxy / Sx*Sy = (1/n)Σ[((Xi-X)/Sx)*((Yi-Y)/Sy)]
共分散をxとyの標準偏差で割る。またはxとyの標準化得点の掛算の合計をnで割ることで求める。
-1~1の範囲に収まる
相関係数が0ならまんべんなくばらつく。正の値で大きくなるほど右肩上がりの直線に近づく。負の値で大きくなるほど右肩下がりの直線に近づく
・偏相関係数
見かけ上の相関(疑相関)の疑いがあるもの
因果関係ではない
見かけ上の相関。つまり疑相関の可能性がある
非線形関係は考慮できない
辺相関係数Rxy z = (Rxy – RxzRzy) / [√(1-Rxz**2)×√(1-Rzy)**2]
※X,Yのばらつき指標(Zの影響を取り除いている)
コメント