본문 바로가기

명사 美 비격식 (무리 중에서) 아주 뛰어난[눈에 띄는] 사람[것]

이론

얼마나 분산되어있는가 = 산포도, 산포도의 지표: 범위, 분산, 표준편차, 사분위수 범위

자료의 수치적 표현에서 산포도 (Dispersion)

데이터가 얼마나 분산되어 있는지를 나타내는 측정 지표

데이터 포인트들이 평균값으로부터 얼마나 멀리 퍼져 있는지

https://standout.tistory.com/1544

 

자료의 시각적 요약과 수치적 요약

자료의 시각적 요약과 수치적 요약데이터를 이해하기 쉽게 전달하기 위한 두 가지 주요 방법시각적 요약 (Visual Summarization)막대 그래프, 선 그래프, 원 그래프, 히스토그램 등데이터의 전반적

standout.tistory.com

 

 

주요한 산포도 지표로는 범위, 분산, 표준편차, 사분위수 범위 등이 있다.

 

범위 (Range)
최댓값과 최솟값의 차이를 나타내는 지표
간단하게 계산할 수 있지만, 이상치에 민감한 단점

분산 (Variance)
평균값에서 얼마나 멀리 떨어져 있는지의 평균적인 제곱 거리

퍼짐 정도를 보다 정확하게 평가

표준편차 (Standard Deviation)
분산의 양의 제곱근으로, 데이터가 평균값 주변에 얼마나 집중되어 있는지

사분위수 범위 (Interquartile Range, IQR)*

데이터의 중앙 50%에 해당하는 범위

75번째 백분위수와 25번째 백분위수의 차이

 

 

데이터가 얼마나 퍼져 있는지를 이해하면,

해당 데이터가 얼마나 일반적이거나 예외적인지를 판단할 수 있다.