본문 바로가기

품질/품질관리

SPC에서 비 정규분포 Data 처리방안

비정규 분포 Data의 정규화 방안에 대한 의견

 

1.     Boxcox에 의한 정규화의 의미

-       Cox 박사가 개발한 비정규 분포를 정규분포로 전환하는 통계적 logic

-       Data 분포가 왜도로 인해 분포의 치우침이 나타났을 때 Data의 정규화(Normalizing) 하는 방법임

-       이는 Data의 치수에 의한 분포가 아니고 분포확률을 기준으로 하여 정규화하는 것으로서 예를 든다면 수능시험에서 학생들의 점수를 정규분포화 하여 시험결과의 등급을 정하는 것과 같은 이론임

(실제 시험점수는 95점이나 정규분포화 했을 때 120점으로 계산되는 것으로 이는 실제 Data분포의 형태에 따라 재조정되는 값임)

 

2.     SPC에 있어 사용의 필요성

-       기본적으로 SPC Data가 정규분포 한다는 가정하에서 통계적 계산을 하는 것을 원칙으로 함

-       실제로 Data가 정규분포 하지 않는 상태에서 통계적 계산을 한다면 오류된 결과를 나타내는 것으로 활용할 수 없는 통계량이 될 것임

-       그리고 만일 정규분포 하지 않는 Data를 정규화하여 통계량을 계산한다고 하는 것도 실제 공정의 상태와는 전혀 다른 결과를 보여주게 될 것임

-       품질관점에서 Data를 다룰 때 사실적 Data를 가지고 공정을 정확하게 사실적으로 정량적으로 평가할 때 공정의 문제를 바르게 알 수 있는 것이 될 것임

-       결론적으로 SPC를 하는 경우 Data의 정규화에 의한 통계적 해석을 하는 것은 바람직하지 못한 방법이며 사실이 비정규 분포한다면 사실을 그대로 두고 정규분포 하도록 개선하는 것이 중요함.

-       일반적으로 정규분포 하지 않는 경우는 Data의 부족, 성격이 다른 집단(이상)과의 Data의 혼합 등이 중요한 이유로서 공정능력을 계산할 때에는 충분히 이상 Data를 배제하고 통계적 계산을 해야 하는 것을 의미함

 

3.     Boxcox에 의한 정규화 방법

-       Boxcox 방법의 변환작업이 필요함

-       Y는 전환 data, y는 실제 data

-       lData 전환을 위해 설정되어야 할 계수

-       결론적으로 가장 중요한 것은 l 값을 찾아내는 것이며 다음은 위의 도표에 의한 것처럼 RE-EXPRESSION 방식으로 재계산된 Y 값을 이용한 공정능력을 계산하면 될 것임

 

4.     SPC 정규화 프로그램을 추가하는 방법

1)     사실적 관점에서는 Boxcox 방법을 사용하지 않고 Data를 사용하는 것이 바람직함

2)     SPC에서 비정규분포 하는 대상을 식별하게 하고 관련 Data를 미니탭을 이용하여 l 값을 조사한 후 SPC 프로그램내에 입력하여 Y 값으로 재계산하여 공정능력 계산

3)     2)의 방법에서 l 값을 계산하는 LOGICSPC 프로그램내에서 계산하게 하고 자동으로 전체 공정능력 재계산

l  위의 3가지 방법이 있으나 현재 l 값을 계산하는 Logic을 개발하여 3)번의 방법으로 개발하는 데는 상당한 시간과 비용이 요구되며 적용한다고 하더라도 Data의 활용성에 문제가 있을 것임.

l  적용하지 않는 것이 바람직하다고 생각하지만 필요에 따라 정규성화가 필요 할 수 있으므로 2)번의 방식으로 개발하는 것도 검토할 필요가 있음.