자료의 수치적 표현에서 산포도 (Dispersion)
데이터가 얼마나 분산되어 있는지를 나타내는 측정 지표
데이터 포인트들이 평균값으로부터 얼마나 멀리 퍼져 있는지
https://standout.tistory.com/1544
주요한 산포도 지표로는 범위, 분산, 표준편차, 사분위수 범위 등이 있다.
범위 (Range)
최댓값과 최솟값의 차이를 나타내는 지표
간단하게 계산할 수 있지만, 이상치에 민감한 단점
분산 (Variance)
평균값에서 얼마나 멀리 떨어져 있는지의 평균적인 제곱 거리
퍼짐 정도를 보다 정확하게 평가
표준편차 (Standard Deviation)
분산의 양의 제곱근으로, 데이터가 평균값 주변에 얼마나 집중되어 있는지
사분위수 범위 (Interquartile Range, IQR)*
데이터의 중앙 50%에 해당하는 범위
75번째 백분위수와 25번째 백분위수의 차이
데이터가 얼마나 퍼져 있는지를 이해하면,
해당 데이터가 얼마나 일반적이거나 예외적인지를 판단할 수 있다.
'이론' 카테고리의 다른 글
숫자에 의미가 있는가, 질적자료와 양적자료 (0) | 2024.06.26 |
---|---|
변수의 측정 척도: 명목 척도, 서열 척도, 등간 척도, 비율 척도 (0) | 2024.06.26 |
자료의 시각적 요약과 수치적 요약 (0) | 2024.06.26 |
수치적 요약 - 대푯값 - 평균의 종류: 산술평균 가중평균 조화평균 기하평균 절사평균 (0) | 2024.06.26 |
수치적 요약의 종류 - 대푯값: 평균 중앙값 최빈값 (0) | 2024.06.26 |