품질/6시그마
다변량 분석
품질경영시스템
2022. 11. 4. 14:04
다변량 분석이란
문자 그대로 해석하면 변수의 양이 많은게 다변량 이겠지요.
가령 어떤 사람이 고등학생의 성적에 어떤 요인들이 가장 큰 영향을 미치는 지를 알고 싶다고 해보죠.
성적에 영향을 미칠만한 것들을 대충 나열해보면..
1)공부시간
2)IQ
3)용돈
4)부모님학력수준
5)학원수강 여부
6)과외 여부
머..기타등등이라고 하고요..일단 위 3번까지만 변수로 잡고..
회귀분석을 한다면
Y=Bo+B1X1+B2X2+B3X3+e
이러한 모형하에..X는 변수 B는 회귀계수..e는 잔차..
(성적) = Bo+B1(공부시간)+B2(IQ)+B3(용돈)+e
이렇게 놓고..만약
(성적)=0.1+4.5(공부시간)+1.1(IQ)+0.001(용돈)+0.5
라는 분석결과가 나왔다면..
공부시간의 회귀계수 값이 가장 크니까..성적에 미치는 영향이 가장크다..라고 결론 내릴 수 있겠죠..(물론 회귀계수들이 표준화되서 변수간 회귀계수를 비교가능하다면요..)
다변량..분석..변수가 많은것들을 분석하는게 다변량 분석이고요 ^^
다변량 회귀분석은 종속변수와 여러가지 독립변수들의 관계를 살펴보는 겁니다.