- 1-1 모집단과 표본
-- 우리들 주변에는 각종의 자료가 널려 있다. 우리는 단순히 숫자들로서의 자료가 아니라 자료에
-- 담겨져 있는 의미를 얻기 위해 자료를 수집하고 분석하는 것이다.
-- 우리가 조사하고자 하는 전체 대상에 대한 자료 집단을 모집단(population)이라 하는데,
-- 모집단의 일부로서 실제로 우리가 얻는 자료를 표본(sample)이라고 부르게 된다.
-- 예를 들면, ××표 형광등의 수명시간을 조사한다고 할 때, ××표 형광등 모든 제품의
-- 수명시간들이 모집단이 될 것이고, 실제로 측정된 개의 수명시간 값들이 표본이 되는 것이다.
-- 또, 집에서 직장까지 출근시간이 얼마나 걸리는가에 관심이 있을 경우라면, 모집단은 수없이
-- 많은 값들로 구성될 것이다. 이때, 일정기간(예로써 한 달)동안 회 측정했다면 그 값들이
-- 표본이 된다.
-- 즉, 모집단이란 조사하고자 하는 대상 전체 또는 대상들이 갖고 있는 관찰치들 전체를 일컫는
-- 말이다. 따라서, 모집단 전체의 자료를 수집한다는 것은 시간적, 경제적 측면에서 불가능하다.
-- 그러므로, 우리는 모집단의 일부에 해당하는 값들을 얻게 되는데, 이를 표본이라고 부르는
-- 것이다.
편의상 표본값들을 x1, x2, x3, x4....................
으로 표현하자.
이 값들은 실제로 측정(관찰)된 값들로써 소문자로 표현되며 이 값들을
-- 컴퓨터에 입력하여 통계처리를 함으로써 우리가 알아내고자 하는 결과물을 얻게 된다.
-- 그러면 모집단을 보다 구체적으로 설명해 보기로 하자. 먼저, 모집단은 조사대상이 되는 자료
-- 전체를 말하므로 무한히 크다고 생각할 수 있고 모집단 전체에 대한 자료는 현실적으로 얻어질
-- 수 없기 때문에 표본값만을 얻게 된다고도 설명할 수 있다.
-- 그러므로 모집단을 설명하기 위해서는 이론적으로 접근할 수밖에 없다.
-- 우리가 조사대상으로 하는 모집단에 대해 조사하고자 하는 값을 변수라고 부르는데,
-- 이를 X라 하자. 여기서 X라는 변수는 어떤 값을 갖을지 모른다. 다만, 어떤 자료인가에 따라
-- 변수 X가 취할 값들의 범위를 알 수 있을 뿐이다.
-- 예를 들어, 대입 수험생들의 대학수학능력고사 점수를 X라고 하자. 그러면 수능시험에 응시한
-- 만 50명 수험생들의 점수를 나타내는 변수 X의 값들이 50만개 존재하게 되는데 각 개인의
-- 점수는 0≤X≤400 에 있다는 것만 알뿐이다.
따라서, 변수 X는 여러가지 값들을 갖게 된다는 것이므로 특별히
X를 확률변수(random variable)라 부르는 것이다.
-- 여기서 변수에 확률이란 말이 붙는 이유는 X가 여러가지 값들을 갖게 되는데 그 값들을 갖게
-- 되는 확률이 존재하기 때문이다.
즉, X가 0점에서 400점까지의 값들 각각에 대해 가질 수 있는
-- 가능성을 확률로 표현할 수 있게 된다는 것이다.
그러므로, 통계학에서 다루는 변수는 모두 확률변수라고 부른다.
'품질 > 통계' 카테고리의 다른 글
기초통계5:확률분포 (0) | 2022.11.03 |
---|---|
기초통계4:확률분포 (1) | 2022.11.03 |
기초통계3:통계량 (0) | 2022.11.02 |
기초통계2:통계량 (1) | 2022.11.02 |
품질과 데이터1 (0) | 2022.11.02 |