특정값이 자료의 다른 관측값들 사이에서 어디에 위치하는지 파악하고자 할 때, 가장 널리 쓰이는 것은 percentile, quartile, standard score(or Z-score) 이다.
전체 자료의 관측값을 increasing order(오름차순)으로 정렬했을 때, 자료를 같은 크기의 100개 구간으로 나누어 주는 값들을 percentiles이라고 한다.
Percentile이 $P_i$인 수는 자료 전체에서 $P_i$보다 작은 관측값이 전체 자료 중에 $i$퍼센트이다. 예를 들어, percentile이 50인 수는 $P_{50}$으로 나타내고 전체 자료 중에 보다 작은 관측값의 비율이 50%이다.
오름차순으로 정렬된 자료를 같은 크기의 4개 부분으로 나누어 주는 값이다.
이 때 4부분을 구분하는 수를 오름차순으로 각각 Q1(first quartile), Q2(second quartile), Q3(third quartile)라고 한다.
주어진 관측값이 평균으로부터 표준편차의 몇 배만큼 떨어져 있는지 나타낸다.
Z-score
$$Z = {(X - \mu ) \over \sigma} $$
$Z$는 Z-score, $X$는 관측값, $\mu$는 population mean, $\sigma$는 population standard deviation
Empirical rule
Z-score는 다음과 같이 해석한다.
$Z<0$ 인 관측값은 mean보다 작다.
$Z>0$ 인 관측값은 mean보다 크다.
$Z=0$ 인 관측값은 mean과 같다.
$Z=1$ 인 관측값은 mean보다 1 standard deviation만큼 크다.
$Z=2$ 인 관측값은 평균보다 2 standard deviation만큼 크다. 등등
$Z=-1$ 인 관측값은 평균보다 1 standard deviation만큼 작다.
$Z=-2$ 인 관측값은 평균보다 2 standard deviation만큼 작다. 등등
관측한 자료의 개수가 충분히 큰 경우에
$-1\le Z\le 1$ 전체 자료의 약 68%는 -1과 1사이의 를 갖는다.
$-2\le Z\le 2$ 전체 자료의 약 95%는 -2과 2사이의 를 갖는다.
$-3\le Z\le 3$ 전체 자료의 약 99.7%는 -3과 3사이의 를 갖는다.
Problem
A national achievement test is administered annually to 3rd graders. The test has a mean score of 100 and a standard deviation of 15. If Jane's Z-score is 1.20, what was her score on the test?
(A) 82
(B) 88
(C) 100
(D) 112
(E) 118
1.3 Graphical Displays - Dot plot (0) | 2017.02.22 |
---|---|
1.3 Graphical Displays - Patterns in Data (0) | 2017.02.22 |
1.2 Quantitative Measures - Measures of Variation (1) | 2017.02.20 |
1.2 Quantitative Measures - Measures of Central Tendency (0) | 2017.02.18 |
1.1 Types of Variables (0) | 2017.02.13 |
댓글 영역