본문 바로가기

품질/통계

(28)
분산분석 오랜만에 통계에 관련된 질문이 있네요... 분산분석에 대해....정리해놓은 자료가 있어 올려 봅니다. ▣ 분산분석(ANOVA) 앞의 가설검정에서는 2개의 평균 사이에 차이가 있는가를 분석하는 방법을 다루었다. 이번에는 3개 이상의 평균 사이에 차이가 있는가를 검정하는 문제를 살펴보자. 어느 공장의 4대의 기계(A, B, C, D)에서 시간당 생산수를 표와 같이 얻었다고 하자. 이 자료로부터 4대의 기계성능이 차이가 있는지 없는지를 알아보자. 반복 A B C D 평균 1 26 30 24 24 2 34 38 30 26 3 33 31 24 28 평균 31 33 26 26 29 우선 자료를 보면 각 기계별 평균 생산량이 다르므로 성능에 차이가 있다고 할 수 있다. 하지만 이 DATA들은 샘플링된 숫자들이기 때문..
[스크랩] 신뢰도 95%란 신뢰도와 정확도 일반인들이 흔히 접하는 통계 중 학교에서 배우는 통계와 가장 접근한 것이 여론조사의 신뢰구간 추정일 것입니다. 그러나 일반인은 물론 당연하지만 통계학을 전공하는 사람조차 신뢰도와 정확도가 의미하는 뜻을 잘 모르는 것 같습니다. 여기서 우리가 일상적으로 쓰는 말을 통해 신뢰도와 정확도의 뜻을 알아 보겠습니다.광고문구를 쓰는 사람들을 카피라이터(copywriter)라 하지요. 카피라이터가 광고문구를 생각할 때도 문구의 다양한 특징(attributes, characteristic)들을 생각합니다. [“문구가 간결한가?], [사람들의 의표를 찌르는가], [강력한 인상을 주는가?] 등등.. 이런 식으로 우리가 쓰는 말에도 다양한 특징들이 있습니다. 통계학에서 보고자 하는 것은 말의 특징은 [신뢰도..
분산분석 분산분석은 3개 이상의 집단들의 평균들간에 차이가 있는가를 검증할 수 있는 기본적인 통계분석기법이다. 다시 말하면, 어떤 이유(인자)에 의하여 집단들 간에 서로 다른 특성이 있는가를 밝혀볼 수 있는 분석기법이라 할 것이다. 예를 들면, 어느 회사에서 제품의 판매 촉진을 위하여 신문, 라디오, TV의 세 가지 광고매체를 이용하였을 때 이 세 가지 광고매체들의 광고효과간에 차이가 있는가를 알아보는 경우 또는 수도권, 충청권, 영남권, 호남권 등의 네 지역들 간에 가구당 월 저축액 평균들이 같은가를 알아보는 경우 등에 대해서 분산분석의 방법을 사용한다. 분산분석은 이렇게 여러 집단간의 평균들의 차이를 알아보는 수단 이외에도 회귀분석에서 그 분석과정의 중요한 부분을 차지하기 때문에 분산분석을 이해하는 것이야말로..
[스크랩] 회귀계수의 목적 목적 1. Y의 실제값과 IV를 통해 예측되는 Y'값간의 차이를 최소화하는(최소자상의 원리) 회귀선을 구해 예측에 필요한 회귀방정식을 만든다. 목적 2. 관찰된 Y값과 예측되는 Y값 간의 상관을 최적화하는 것으로 최소자승을 통해 편차가 최소화할 때 예측되는 Y값과 관찰된 Y 값간의 상관이 가장 높아지면 이를 통해 IV 효과를 파악할 수 있게 된다. 출처 : 아낌없는 격려와 힘을!!! 글쓴이 : 반찬 원글보기 메모 :
[스크랩] F분포의 특징 →표준정상분포가 양과 음의 값을 갖는 것과는 달리 F분포의 보양은 분자와 분모의 자유도에 따라 달라지지만 일반적으로, 0과 +∞의 범위를 가지고 있다. F분포는 한 개의 최빈값(mode)를 중심으로, 정적으로 편포된 비대칭적 양상을 지닌 분포이다. 이 분포의 특징은 먼저, 두개의 변량 추정치(비의 분자, 분모)로 계산되므로 F값은 항상 양수이다. 둘째, 영가설이 참일때 F비의 분자, 분모는 같은 변량추정치를 갖는다. 이때 두 표본변량추정치는 거의 같은 크기이며, 따라서 비는 ‘1’에 가깝다. 다시 말해 F비의 분포는 1주위에 높이 쌓인다. F 분포는 ‘0’에서 잘리며(모두 양수), 1주위가 높이 놀라가고 오른쪽으로 점점 작아진다. F분포의 정확한 모양의 분내의 두 변량추정치의 자유도에 달려 있다. →F ..
[스크랩] 표준정규분포와 t분포의 차이 →표준정규분포는 모든 측정치를 표준점수로 계산하여 평균 ‘0’이고 표준편차 ‘1’을 가진 정규분포로 변화시킨 분포곡선으로, 각 측정치에 대한 Z 점수는 편차점수(각 측정치와 평균간의 차이)를 표준편차(편차들의 평균)로 나눈 값이다. 즉, 원점수 분포의 값과 관계없이 미리 결정된 모평균과 표준편차값을 갖는 변형된 점수로 구성되어 있는 분포이다. 이 분포는 평균과 표준편차가 상이한 분포를 동일선상에서 비교하기 위해 사용된다. Z점수를 통해 분포내의 상대적 위치를 알 수 있으며, Z점수의 부호는(+,-) 점수가 평균 이상일지(+), 이하일지(-) 알려주고, 수치는 X와 μ사이의 표준편차의 수를 세어서 평균으로부터의 간격을 명시한 것이다. 표집의 원점수는 분포내의 위치에 관해 많은 정보를 주지 못하므로, 점수의..
꽁트2 수리는 이태백이다. 더운 여름 남들은 피서다뭐다하면서 분주할 때 도서관에 앉아 공무원 준비를 하고 있다. 취업에 계속 실패하다보니 사오정이란 단어가 예사롭게 느껴지지 않았다. 나름 어려움은 있겠지만 그래도 철밥통 직업을 준비하는 것이 가장 현명한 선택 같았다. 하지만 그런 철밥통에 들어가는 일이 어디 쉬운 일인가, 한번 미끌어지고 두 번 넘어지니 K2봉을 정복하는 일보다 더 어려워 보인다. 그래서 요즘 수리가 매우 집중하여 하는 일은 로또 복권의 번호를 추정하는 것이다. 하지만 공무원 경쟁률도 못 뚫는 놈이 벼락 맞을 확률을 뚫는다고 생각하는 자체가 어리석은 일이 아니겠는가. 하지만 인생이라는 것은 엉뚱한 곳에서 전혀 다른 방향으로 흘러가곤 한다. 점심을 먹고난 후 늘 그랬던 것처럼 낮잠을 자기위해서 숲..
노스트라다무스 에언 노스트라다무스 예언의 평가 예언가나 점쟁이에 대한 평가는 매우 후하다. 평가방식에 문제가 있기 때문이다. 대개는 맞힌 사실만 뉴스거리가 되고 떠벌려진다. 세계적으로 유명한 예언자는 아무래도 16세기에 살았던 노스트라다무스일 것이다. 그는 2차세계대전,케네디 암살 등 굵직굵직한 사건들을 예언했다 하여 유명해진 사람이다. 그러나 그가 그의 예언서인 '세기(Centuries)'에서 3000개가 넘는 예언을 했다는 사실을 사람들은 염두에 두지 않는다. 예언의 정확성을 평가하려면 그의 모든 예언으로부터 무작위로 표본을 추출해 얼마나 맞게 예언했는지를 평가해야 한다. 예언의 정확성을 제대로 평가한다면 노스트라다무스의 예언은 보통 사람의 예언이 우연히 맞을 경우보다 못할지도 모른다. 어떤 역술인의 점이 몇 %나 맞는..