본문 바로가기

outlier

(2)
1.3 Graphical Displays - Box plot 1.3 Graphical Displays 5. Box plot (or Box and Whisker Plot) Box plot은 box and whisker plot이라고도 부르며, quantitative data를 나타내는데 사용한다. Box plot은 자료를 quartile에 따라 구분한다. Box plot의 body는 Q1에서 Q3까지의 "box"로 나타낸다. 상자 안에는 Q2를 나타내는 세로줄이 그어져 있는데 이것은 바로 자료의 median이다. 상자의 좌, 우에 뻗어있는 두 개의 수평선은 whisker라고 부른다. 왼쪽 whisker는 Q1에서 outlier가 아닌 자료의 최솟값까지 긋고, 오른쪽 whisker는 Q3에서 outlier가 아닌 자료의 최댓값까지 긋는다. 만일 하나 이상의 outli..
1.3 Graphical Displays - Patterns in Data 1.3 Graphical Displays 1. Patterns in Data 자료를 시각적으로 나타내는 것은 자료 형태를 통해 유용한 정보를 알아내기 쉽도록 도와준다. 자료 형태는 center, spread, shape과 unusual feature(gap, outlier)를 통해 기술한다. Center자료 분포에서 median이 위치한 곳을 말한다. 보통 center는 분포 양 끝에서 절반 정도 되는 지점이다. 다음 그림에서 각 열의 높이는 관측값의 빈도를 나타낸다. 관측값은 5를 중심으로 모여 있다. Spread 자료의 variability를 나타낸다. 만일 관측값이 넓은 범위에 퍼져 있다면 spread가 크고, 특정한 값 주위에 모여 있다면 spread는 작다. 왼쪽의 자료는 범위가 1 ~ 9까지 ..