표본 데이터에서 모집단의 비율을 추정해보자
- OO이상 OO이하 라는 범위를 추정하는 행위를 '구간 추정'이라고 하고 추정된 범위를 '신뢰 구간'이라고 한다. '틀림없을 것이다'라고 생각하는 정도를 '신뢰율'이라고 한다.
- 모집단에서 무작위로 표본을 추출했다 되돌리는 행위를 끝없이 반복하면 그 히스토그램의 계급폭을 좁힌 최종 모습은 정규 분포 그래프로 간주할 수 있다.
- 평균은 모집단의 비율(평균)인 $\mu $와 비슷하다.
- 표준편차는 모집단의 표준편차를 표본 인원수의 루트로 나눈 $\frac{\sigma}{\sqrt{n}} $와 비슷하다.
- $-1.96 \leq \frac{\bar{x} - \mu}{\frac{\sigma}{\sqrt{n}}}\leq 1.96$
- 모집단에서 무작위로 표본을 추출한 뒤 되돌리는 행위를 무한대로 반복했을때 그 중 다음과 같은 관계가 성립하는 비율이 0.95다 = 신뢰율 95%
- $\bar{x}$는 표본의 비율, n은 표본의 인원수이다. $\sigma$는 모집단의 표준편차이다.
- 신뢰율은 신뢰 구간을 구한 뒤에 '판명 되는 것'이 아니라 신뢰 구간을 구하기 전에 '분석자가 지정해아 하는 것'이다.
📌정리
- 통계학에서는 '모집단의 비율인 $\mu$ 값이 OO이상 OO이하인 범위에 들어가면 틀림없을 것이다라고 추론할 수 있다.
- O이상 O이하라는 범위를 추정하는 행위를 '구간 추정'이라고 하며 추정된 범위를 '신뢰 구간'이라고 한다. 또 '틀림없을 것이다'라고 생각할 수 있는 정도를 '신뢰율'이라고 한다.
'Math > Statistics' 카테고리의 다른 글
통계적 가설검정이란? (0) | 2023.03.25 |
---|---|
데이터 가시화 - 정규 분포 (0) | 2023.03.25 |
데이터 분위기 파악하기 - 범주형 데이터 (0) | 2023.03.25 |
수량 데이터 (0) | 2023.03.25 |
'무늬만 조사'에 휘둘리지 않는 무작위 추출법 (0) | 2023.03.23 |