-
[기초통계] 표집분포Study/Statistics 2019. 5. 31. 16:50
통계량도 확률분포를 가진다(표집분포) 그래서 분포를 봤더니 모집단에 상관없이 표본의 크기가 30이상이면 정규분포를 따름
통계학의 핵심은 표본으로부터 모집단의 성격을 알아내고자 하는 추론(inference)!!
=> 적절한 표본추출법에 의한 표본이 전체 모집단의 특성을 잘 반영하고 있기 때문에, 일부분을 가지고 전체에 대해 일반화하여 이야기할 수 있음
모수(parameter) : 수치로 표현되는 모집단의 특성 예) 모평균, 모비율, 모표준편차,,,
통계적 추론 : 제한된 표본으로부터 모수를 추론하는 이론적인 뒷받침 제공
통계량(statistic) : 표본의 관측값들에 의해 결정되는 양 예)표본상관계수, 표본표준편차,,,
통계량 유의할 점
1. 표본은 모집단의 일부분이므로 표본으로부터 계산된 통계량의 값은 모수의 참값과는 통상적으로 같지 않음
2. 통계량의 값은 그 당시 추출된 표본에 영향을 받음
3. 다른 표본을 추출할 때마다 통계량의 값은 변함
통계량의 확률분포 : 표집분포
통계량의 값은 매 표본추출마다 달라지기 때문에 통계량은 확률분포를 갖게 됨
=> 반복되는 표본추출에서 통계량 값의 변동은 확률분포에 의해 설명 가능
임의표본(random sample) : 임의추출된 크기가 n인 표본들은 서로 독립이고 모두 모집단의 분포와 같은 분포를 갖는것으로 간주함
표집분포 구하는 방법
1. 모든 가능한 표본의 종류를 나열
2. 각 표본에서 통계량의 값을 구함
3. 통계량이 취하는 각 값에 대응되는 확률 계산
모집단과 표본의 크기가 커짐에 따라 방대한 계산을 요구하게 되기 때문에 정확한 분포보다는 근사적으로 간단한 분포를 구하는게 좋음 =>
표본평균의 분포
표본평균 분포의 중심은 모집단의 중심μ와 일치
표본평균의 표준편차는 크기에 영향을 받아 표본의 크기 n이 증가함에 따라 표본평균의 표준편차는 n의 제곱근에 반비례해서 감소
= 표본의 크기를 100배 늘리면 표본평균의 표준편차는 1/10로 감소하여 표집분포가 μ를 중심으로 집중됨
정규모집단에서 표본평균의 분포는 정규분포임
중심극한정리(Central Limit Theorem)
모집단의 분포가 연속적, 이산적, 대칭, 비대칭에 상관없이,
표본의 크기 n이 큰 경우(30개 이상) 표본평균의 분포는 모집단의 분포와 무관하게 근사적으로 정규분포를 따름
표본의 크기가 충분히 큰 경우(30이상) 표준정규분포표를 이용하여 표본평균에 대한 확룰을 구할 수 있음
'Study > Statistics' 카테고리의 다른 글
[기초통계] 정규분포 (4) 2019.05.31 [분석/통계] 그리드 서치 (0) 2019.05.29 [분석/통계] 교차검증 (0) 2019.05.29 [분석/통계] 비지도학습 - 군집(K-MEANS, 병합군집) (2) 2019.05.28 [분석/통계] 데이터 전처리와 스케일 조정 방법 (0) 2019.05.28