본문 바로가기

품질/통계

(28)
우연의 일치 우연의 일치는 대부분의 사람들이 생각하는 것보다 더 자주 일어난다. 가장 흔한 예를 들어 보자. 처음 보는 사람과 대화를 나누다가 그 사람이 자기 친구의 친구이거나,아는 사람의 친척이라는 것을 알고는 놀라는 적이 종종 있다. 그럴 때마다 사람들은 "세상이 참 좁군요"라고 말한다. 어떤 사람들은 여기저기에서 우연의 일치를 찾아낸다. "콜럼버스가 1492년에 신대륙을 발견했는데,같은 이탈리아인 페르미(Enrico Fermi)는 1942년 원자(atom)의 신세계를 발견했다" "기네스 북에 오른 우리나라 신동(神童)의 부모는 생일이 같다" 등등 그 사례는 매우 많다. 미국 대통령이었던 링컨(Lincoln)과 케네디(Kennedy)의 우연의 일치 목록을 보자. 링컨은 1860년,케네디는 1960년 대통령에 당선..
통계꽁트1 통계꽁트-냉철한 사고를 가진 가족 가족들이 오랜만에 모여 저녘 식사를 하고 있었다. 오랜만에 식사를 하지만 분위기가 별로 좋지 않다. 막내의 기말고사 성적이 별로 좋지 않기 때문이다. 엄마 회귀분석은 못마땅한듯 밥을 먹지 않고 국에 밥을 말아 이리저리 숟가락으로 휘젓고만 있다. 그러더니 못참겠다는듯 작은 한숨을 내쉬며 얘기를 꺼낸다. "게임을 너무 많이 하니 그래. 모든 결과에는 원인이 있기 마련이야. 내가 볼 때 하루 한 시간 게임을 하면 전체 평균 정수가 10점이 내려가게 되어 있어. 점수를 회복할려면 하루 30분으로 줄어야해." 그 말을 듣던 분산분석 아버지는 고개를 흔들더니 "그렇지 않아. 중간고사와 기말고사의 점수대를 살펴봐야해. 두 시험의 분포가 같다고 할 수가 없어. 이번 기발 고사의 전체 ..
통계기초17:제1종의 오류 앞에서 유의 수준에 관한 정리를 해보았는데 사실 어렵다....뭔말인지...ㅎㅎ 우리 가게(중국집)의 매출 향상을 위해 가게내부의 전등을 더밝게 교체했다. 교체 전의 평균 매출은 일 100만원이었고 보통 80만원에서 120만원 사이의 매출을 올리고 있었다. 전등의 교체후 즉시 효과가 있을 것라고는 볼 수 없기 때문에... 한 달 후 매출을 보기로 했다. 꼭 한달이 지난후 어느날 매출이 110 만원이었다. 효과가 있었던 것인가?.......?? 하루로는 알 수 없다는 의견에 그러면 10일간의 평균을 계산해 보았다. 10일 평균이 105만원이었다.... 그러면 조명이 매출향상에 영향을 주었다고 할 수 있는가? 내가 보기에 영향을 주는것 같다....하지만 정말로 확실한가?....모르겠다.... 여기에서 보자 1..
통계기초16:유의수준 6-3 유의수준 모집단에 대해 어떤 주장이 맞는가를 판단하기 위해서는 표본을 얻어 표본으로부터 구해진 결과를 이용해야 한다는 것은 당연하다. 그러나, 모집단 전체에 대해서는 영원히 모르는 것이기 때문에, 가설 검증의 과정을 거쳐 의사결정을 할 때 과오(오류)를 범할 수도 있을 것이다. 왜냐하면(하나님만이 알고 있을) 모집단 전체에 대한 값이 어떻다는 판단을 하는 데 표본을 통하여 사람이 판단하기 때문이다. 물론 이 또한 정확하게 안다는 것은 불가능 한 것이 아니겠는가. 따라서 신뢰도...%에 얼마에서 얼마까지라고 구간으로 추정 할 수 밖에 없는 것 아닌가. 여기에서 문제는 신뢰도를 어떻게 해야 하는가이다. 이 신뢰도에 따라 가설이 옳다 그르다를 따질 수 있는 유의 수준이 결정되기 때문이다. 먼저, 귀무(..
통계기초15:가설검증 6. 가설검증 모집단에 대한 어떤 주장, 기술, 가정을 가설(hypothesis)이라고 부르는데 이 가설의 정당성 여부를 판단하는 일련의 과정을 가설검증(hypothesis test)이라고 한다. 예를 들면 고등학교 학생들의 학력이 매년 낮아지고 있다든가, 취학연령 아동의 키는 여자가 남자보다 크다 등등을 가설이라고 할 수 있다. 6-1 귀무가설과 대립가설 모집단에 대해 알아보고자 하는 바를 가설로 표현하고자 할 때 귀무가설(null hypothesis)과 대립가설(alternative hypothesis)의 두 가지로 나누어 가설을 설정한다. 귀무가설(또는 영가설)과 대립가설은 특정한 문제에 따라 일정한 형태로 표현되지만 대체로 [새로운 주장], [흥미 대상이 되는 가설], 또는 [전과 같지 않은 사실..
통계기초14:추정(구간추정) 5-2 구간추정......너무도 중요하다.... 일상생활에서 확실히 알지 못하는 어떤 값에 대한 표현으로 「어떤 정도이다」라고 한다. 이를테면, 어느 전시장의 시간당 입장객 수는 40~50명 정도라고 하거나, 그 회사 임원들 연봉이 5000~6000만원 정도 된다고 한다. 이렇게 (모집단에 대해서) 모르는 어떤 값(파라메터)을 추정하는 데 있어 하나의 값으로 추정하는 것이 아니고 구간으로 추정하는 것을 구간추정이라고 한다. 이와 같이 모집단의 파라메터를 추정함에 있어 표본으로부터 얻어진 하나의 값으로 추정을 하는 것(점추정)보다는 그 파라메터가 어느 구간 내에 들어 있을 것으로 표현(추정)하는 것이 더 적절한 경우가 있을 것이다. 예를 들어, 어느 제품의 시장점유율이 37%라고 점추정하는 것보다는 (35..
통계기초13:추정(점추정) 5.추정 추정(estimation)이란 모르는 값을 추측하여 알아내는 것을 말한다. 추정이라는 개념은 장래시점의 모르는 값을 추측하여 알아내는 예측(forecast)과는 구별되어 사용되지만, 예측을 추정의 범주에 포함시켜 생각해도 무방하다. 어느 슈퍼에서 1일 평균판매액이 얼마인가를 추정한다고 할 때 어느 특정한 하루의 판매액으로 추정하는 것보다는 며칠에 걸쳐 얻어진 판매액들의 평균값으로 추정하는 것이 바람직할 것이다. 다른 예로써, 어느 초등학교 전교생 중에서 가장 키가 큰 학생은 몇 cm가 될 것인가를 알고 싶을 경우, 표본으로 50명의 학생들의 키를 얻는다고 할 때, 50명의 표본값들 중에서 가장 큰 값으로 전교생 최장신의 키를 추정할 수 있을 것이다. 이와 같이 우리는 표본으로부터 모집단의 성격을..
통계기초12:표본추출방법 3-6 표본추출방법 -- 실제조사업무에서 표본을 제대로 얻는 것은 곧 작업의 성패를 가름할 만큼 중요한 일이다. -- 그러므로 성공적인 조사업무를 위해서는 모집단을 잘 대표할 수 있는 표본의 추출 방법을 -- 제대로 이해해야만 할 것이다. 먼저, 표본추출을 위하여 모집단에 대한 대표성이 확실히 -- 보장될 수 있는 추출방법을 선정해야 하는데 크게 확률적 추출과 비확률적 추출로 구분할 수 -- 있다. 3-6-1 확률적 추출 - 모집단을 구성하고 있는 모든 요소가 표본으로 선정될 수 있으며 다음과 같이 네 가지 -- 방법이 있다. 1) 단순무작위추출(simple random sampling) -- 모집단을 구성하고 있는 각 개체가 표본으로 뽑힐 가능성이 같도록 하는 추출방법이다. -- 예를 들어 10명의 농..