2-2 확률변수와 확률분포
이미 설명한 대로 모집단은 미지의 아주 큰 집단이다.
모집단에 대해 궁금한 것이 있다면 그 알고자 하는 것이 변수가 되는 것인데 변수가 어떤 값을
가질 가능성을 확률로 표현할 수 있으므로 그 변수를 확률변수라 부르는 것이다.
-- 다시 말하면, 확률변수 는 X가 취할 수 있는 범위 내에서의 각 X값에 대해 확률을 갖게 되는데
-- 이를 확률분포라 부르고 로 표현한다. 즉,
라고 표현할 수 있다.
-- 예를 들면, 하나의 동전을 던진다고 할 때 앞면(H)과 뒷면(T)이 가능한데,
X = 앞면의 수
로 정의하면, X가 취할 수 있는 값은 {0, 1}이다. 즉,
와 같다. 그러면 의 두가지 값 0과 1에 대한 확률이 존재하는데 정상적인 동전이라면
-- (앞면과 뒷면이 나올 확률이 똑같이 0.5이므로),
여기에서 x는 0 혹은 1이다.
f(X)의 확률분포가 된다.
-- 이를 그래프로 나타내면, 다음과 같다.
확률변수와 확률분포에 대해 구체적인 예는 무수히 많지만 여기서는 하나의 예만 더 들어보기로 한다.
전국 승용차보유자들의 월평균 주행거리()는 대체로 를 1100㎞중심으로 분포되어 있다고 하자.
그러면 X의 값들이 [그림 2-1]에서 보는 바와 같이 (A), (B), (C) 등과 같은 형태의 분포를 한다고 할 수 있다.
즉, 실제로는 모든 승용차보유자들의 월평균 주행거리 자료를 얻어야만의 정확한 분포를 얻을 수 있는 것이지만,
모든 승용차보유자들에 대한 자료를 얻을 수 없기 때문에 f(x)의 정확한 분포모양은 알 수가 없다.
다만, 상당히 많은 사람들을 통해 얻어진 자료로써 f(x)의 형태를 추측할 수 있을 뿐이다.
통계이론에서는 모집단 전체의 내용을 모르기 때문에 조사하고자 하는 변수(확률변수)가 어떤 특정한(이론적으로 정리된) 분포형태를 갖는다고 가정하는 경우가 많다.
확률변수 f(x)는 모집단에 대해서 알고자 하는 바를 나타내는 변수이며
형태가 어떻든 간에 확률분포를 한다고 생각하면 된다.
통계학에서 다루는 분포의 수는 대체로 10여 가지 된다.
특히, 어떤 경우의 자료는 특정한 분포를 한다고 간주할 수 있는데 이는 통계학자들에 의해
경험적으로 발견된 것이라고 보면 된다.
예를 들면, 어느 기마병 부대에서 하루 훈련 중 낙마한 훈련대원의 수를 나타내는 변수는
포아송(Poisson)분포란 분포를 한다고 하고,
은행이나 병원 등의 창구에서 대기중인 사람들의 수를 나타내는 변수는 기하(geometric)분포란
분포를 한다고 보면 된다.
그리고 많은 연속적인 확률변수는 정규(normal)분포를 한다고 간주해도 될 것이다.
여기서는 아주 간단하고 중요한 두개의 분포만을 대상으로 설명하기로 한다.
'품질 > 통계' 카테고리의 다른 글
기초통계7:베르누이 정리 (0) | 2022.11.03 |
---|---|
기초통계6:기대값 (0) | 2022.11.03 |
기초통계4:확률분포 (1) | 2022.11.03 |
기초통계3:통계량 (0) | 2022.11.02 |
기초통계2:통계량 (1) | 2022.11.02 |