본문 바로가기
Charts

[Excel] 상자-수염 그림으로 산포도를 측정

by 뚜벅이라이프 2015. 12. 22.

상자-수염 그림은 산포도를 측정할 목적으로 통계학에서 사용하는 그림입니다. 같은 목적으로 표준편차를 계산하여 산포도를 측정하기도 하지요.

기본 데이터를 그대로 사용하지 않고, 최소값, 제1사분위, 제2사분위, 제3사분위, 최대값을 이용한답니다. 이전 버전의 엑셀에서도 위 값들은 계산이 가능했지만, 이를 그림으로 표현하는것은 불가했습니다.


엑셀 2016에서는 새롭게 추가된 그래프 타입에 상자-수염 그림(Box and Whisker)이 추가되었으며, 오늘 포스팅은 이에 대한 내용입니다.

 

상자-수염 그림

과목별 성적분포

20명의 학생들의 5과목에 대한 성적입니다. 단순히 이 표만 봐서는 특별히 눈에 들어오는 것이 없습니다. 그냥 성적표일 뿐입니다.



아래는 평균값입니다. 이제야 학생들의 성적이 어느 과목이 좋고 어느 과목이 그렇지 않은지 대략 감이 잡힙니다.




상자-수염 그림을 그리기 위한 5가지 값을 구해 보겠습니다. 각각의 값을 구하기 위해 다음의 함수를 사용했습니다. 최대값은 MAX, 최소값은 MIN, 중앙값은 MEDIAN, Q1은 QUARTILE(범위,1), Q3은 QUARTILE(범위,3)  


QUARTILE


상자-수염 그림

이제 상수-수염 그림을 작성해 보겠습니다. 주의하실점은 각 학생의 번호(이름이 될수도 있습니다.)는 범위선택을 하시면 안됩니다. 아래 그림처럼 점수에 해당하는 영역만 선택해야 합니다.



완성된 상자-수염 그림입니다. 155는 1.5IQR(INTERQUARTILE)을 벗어나는 값이므로 영역밖의 점으로 표현되었습니다. 100점이 만점인데, 표현가능하다는 것을 보여주기 위해 임의로 155라는 데이터값을 포함시켰습니다. (Q1, Q3는 상자의 위.아래의 경계선이 되고, 수염에 해당하는 부분은 1.5IQR에 해당하는 값입니다. 155 와 같이 범위에서 벗어나는 값을 이상값이라 합니다.)


상자-수염 그림


이를 통해 각 과목의 성적분포 양상이 어떠한지, 나아가서는 각 그룹(과목)간의 차이를 파악하는데 용이합니다. 서식편집은 엑셀의 차트를 편집하는 방법과 동일합니다. 혹시나 이거 기존에 있던 주식형차트(봉차트)와 같은거 아니냐고 생각하실 수도 있는데요. 다르답니다.^^


글을 쓰다 보니 어쭙잖은 통계학 강의가 되어버린것 같네요. 여튼, "상자-수염 그림" 유용하게 사용하세요.


 

엑셀