분산

Math/Statistics

수량 데이터

데이터는 수량 데이터와 범주형 데이터로 나눌수 있다. 물론 나누는 방식은 더 여러가지가 있다. 수량 데이터를 양적 데이터라고도 부른다. 범주형 데이터를 질적 데이터라고도 부른다. 데이터가 흩어진 정도를 수치화해 보자 데이터가 표에만 들어있으면 어쩌다 눈에 들어온 수치에만 주목하는 경향이 생기게 된다. 평균은 수량 데이터의 분위기를 파악할 떄 쓰는 기본 중의 기본인 방법이다. 제곱합, 분산, 표준편차는 '데이터가 흩어진 정도'를 나타내준다. 제곱합과 분산, 표준편차의 최솟값은 모두 0이다. 제곱합은 평균을 기준점으로 삼은 후 데이터가 흩어진 정도를 수치화한 것 (각 데이터의 평균)^2을 더한 것 데이터의 개수가 많아질수록 값도 커지는 치명적인 단점이 존재. 제곱합의 약점을 해결해주는 '분산' 분산은 제곱합..

한상희
'분산' 태그의 글 목록