94년생 스피노자

[노트] 표본의 평균값을 활용하는 이유 본문

코드스테이츠 AI 부트캠프/i) 데이터사이언스 기본

[노트] 표본의 평균값을 활용하는 이유

94년생 스피노자 2021. 5. 15. 11:02
728x90

표본 추출

t-test, ANOVA 등 다양한 통계 분석에는 표본의 평균이 쓰인다.

이번 노트에서는 그 이유에 대해서 설명하고자 한다.

 

아래 표를 보면 모든 것이 설명된다.

source : https://stats.libretexts.org/@go/page/570

모집단의 분포가 어떻든 표본집단의 평균의 분포는 정규분포가 된다.

물론 표본집단의 크기가 어느정도 커야 한다.

학술적으로는 하나의 표본집단이 30개의 샘플을 가져야 한다고 본다.

 

제멋대로였던 분포가 평균을 활용하며 정규분포가 되는 것은 매우 중요하다.

정규성이 보장되어야 활용할 수 있는 t-test와 같은 도구를 쓸 수 있기 때문이다.

 

 

모두 행복하길

 

-끝-

728x90