표본평균의 분포에 대해 사례로서 이해를 해보자...
[중심극한정리(Central Limit Theorem)]
여기서, 표본의 크기가 충분히 클 경우란 경험적으로 n=30이상일 경우를 말한다.
중심극한정리는 표본평균의 분포를 정규분포로 취급해도 좋다는 가이드라인을 설정해 주는
중요한 정리이다.
왜냐하면, 모집단의 자료들이 (확률변수 X가) 어떤 분포를 하는지
모르더라도 표본평균 에 대한 분포가 정규분포한다고 할 수 있는 근거를 제공해주기
때문이다.
그러나, 표본의 크기가 작을 경우, 예를 들어 n = 10일 경우에 표본평균의 분포
정규분포를 따른다고 하기에는 큰 무리가 될 수 있다.
물론 모집단이 정규분포하면 표본의 크기에 관계없이 표본평균은 정확하게 정규분포한다.
병원에서 환자들이 도착하여 진료를 받기까지의 대기시간은 환자들이나 의사들에게 모두 필요할 수 있는데 그 대기시간을 잘 분석 조정해야만 한다.
즉, 환자들의 입장에서 보면 약속시간 정각에 도착하지 못할 경우 대기시간 내에 도착하면 대기자 명단의 뒤로 빠지게 되는 불행을 면할 수 있을 것이고 의사들의 입장에서는 환자를 보는 데에 따른 돌발적인 일들(X-ray를 찍거나 검사자료 요구 등)을 처리하는 시간을 확보할 수 있다.
그러나, 환자들은 오래 기다리면 무료함으로 짜증이 나거나 또 자신들의 약속 스케줄 (경제활동) 때문에 그 병원을 찾지 않을 수도 있을 것이다.
그러므로, 의사들은 적정한 평균 대기시간을 파악하여 환자들의 수를 효과적으로 정해 놓아야만 한다.
예를 들어, 어느 종합병원에서는 모든 소아과의사들에게 각자 파악한 환자들의 대기시간을 보고해 달라고 요청하였다.
전체 50명의 소아과 의사들이 보고한 자료들의 평균은 24.7분 표준편차는 19.3분이었다.
의사들은 각자 자신의 컴퓨터에 입력되어 있는 모든 환자들의 대기시간들을 보고하였기 때문에 평균 24.7분 표준편차 19.3분은 그 종합병원을 방문한 소아과 환자들 전체(모집단)의 평균 과표준편차 가 될 것이다.
어느 소아과 의사는 병원의 종합기획실에 보고된 소아과 의사 전체 50명의 평균(24.7분), 표준편차(19.3분)을 모르고 있는 상태에서 자신의 진료시간을 효율적으로 운영하기 위해서는 환자들의 평균 대기시간이 22분 정도일 것으로 생각해 왔다.
그는 자신의 생각을 확인하기 위해서 환자들 대기시간들 중에서 100개의 자료를 뽑아 표본 평균을 구하여 그 값이 19분에서 25분사이에 있으면 현재까지 해오던 방식으로 환자들과 약속하면 될 것이고 생각하였다.
..1) 그 소아과 의사가 얻은 표본의 평균은 어떤 분포를 하는가?.........................................
. 2) 그 의사의 표본평균이 (19분∼25분)사이에서 얻어질 확률은?
.3) 그의 표본평균이 (19분∼25분)사이에서 얻어질 확률이 55.8%라는 것은 상당히 높은
.... 가능성을 나타내고 있다.
다시 말하면, 그가 전체 소아과 환자들의 평균대기시간이 22분 정도 된다고 믿을 가능성이
55.8%나 된다.
즉, 환자들과의 약속 시스템을 바꾸어야 함에도 바꾸지 않을 오류를 범하게 될 것이다.
'품질 > 통계' 카테고리의 다른 글
통계기초13:추정(점추정) (0) | 2022.11.10 |
---|---|
통계기초12:표본추출방법 (0) | 2022.11.10 |
통계기초10:통계량 (0) | 2022.11.04 |
기초통계9:표본이론 (0) | 2022.11.04 |
기초통계8:표준정규분포 (0) | 2022.11.04 |