본문 바로가기

quantitative data

(3)
1.3 Graphical Displays - Box plot 1.3 Graphical Displays 5. Box plot (or Box and Whisker Plot) Box plot은 box and whisker plot이라고도 부르며, quantitative data를 나타내는데 사용한다. Box plot은 자료를 quartile에 따라 구분한다. Box plot의 body는 Q1에서 Q3까지의 "box"로 나타낸다. 상자 안에는 Q2를 나타내는 세로줄이 그어져 있는데 이것은 바로 자료의 median이다. 상자의 좌, 우에 뻗어있는 두 개의 수평선은 whisker라고 부른다. 왼쪽 whisker는 Q1에서 outlier가 아닌 자료의 최솟값까지 긋고, 오른쪽 whisker는 Q3에서 outlier가 아닌 자료의 최댓값까지 긋는다. 만일 하나 이상의 outli..
1.3 Graphical Displays - Stemplot 1.3 Graphical Displays 4. Stemplot (or Stem and Leaf Plot) Histogram은 각 group에 속한 관측값들이 분포하는 모양을 보여주지만 그룹에 속한 관측값의 정확한 값을 나타내지는 않는다. 반면에 stemplot은 분포 모양과 함께 각 관측값의 정확한 값을 함께 보여준다. Stemplot은 quantitative data를 나타내는데 사용하며, 일반적으로 자료의 개수가 많지 않은(50 이하) 경우에 사용된다. 다음 stemplot은 어느 학교의 6학년 학생 30명의 IQ를 나타낸 것이다. Stemplot에서 왼쪽에 있는 항목들을 stem이라고 하고 오른쪽에 있는 항목들을 leaf라고 한다. 위의 stemplot에서 stem은 십 단위(80, 90, 100~..
1.3 Graphical Displays - Bar chart and Histogram 1.3 Graphical Displays 3. Bar chart and Histogram Dot plot과 마찬가지로 bar chart와 histogram은 다른 group 간 크기를 비교하는데 사용된다. Bar chart에서는 다음과 같이 각 열을 나타낸다. ▶ 각 열은 categorical variable을 나타내는 label 위에 나타낸다. ▶ 각 열의 높이는 열 label에 의해 정의된 group의 크기를 나타낸다. 다음은 4개 주(New Jersey, New York, New Hampshire, New Mexico)에서의 average income을 나타낸 bar chart이다. Histogram에서는 다음과 같이 각 열을 나타낸다. ▶ 각 열은 quantitative variable을 나타내는..