• Tidak ada hasil yang ditemukan

3.3 정규분포-첨도-왜도 분석

3.3.1 정규분포 평가

 

 

(5)

여기서,

 : X의 평균  : X의 표준편차

식 (5)의 분포는  →∞일 때 표준정규분포에 가까워진다.

lim

→∞

 ≤≤   



 



이러한 이론을 중심극한정리(Central limit theorem)라고 한다. 이 이론은

“모집단의 실제 분포에 관계없이 표본 크기인 n이 증가할수록 표본평균의 분 포는 정규분포에 근사한다.”는 것을 말해주고 있다. 즉, 충분한 수의 통항이 이루어진다면 정규분포를 따른다고 보아도 무방하다는 것이며, 일반적으로 30 회 이상인 경우 정규분포를 따른다고 알려져 있다(장석호, 2018). 이러한 경험 학적, 통계학적 이론의 근거를 토대로 국내에서도 항행 선박의 항로 이탈 확 률, 해상교량 교각과의 충돌확률 평가 등에 정규분포로 가정하여 분석하여 왔 다. 특히, 최적 확률분포가 특정분포로 한정되지 않는 상황에서 정규분포를 적 용할 것인가에 대한 부분은 추가 연구가 필요한 실정이다.

관측값들이 정규분포를 따르는 모집단에서 취하여 졌는지를 검정하는 것 을 정규성 검정이라 하지만, 본 논문에서는 ND 평가라고 정의하였다. ND 평가는 선박의 통항분포를 분석하기 위한 평가로서 다양한 평가방법이 있 으나, 본 연구에서는 KS 검정에 비해 더 강력한 Shapiro-Wilk (이하 SW)검정 을 시행하였다(Stephens, 1974).

SW test는 1965년 Shapiro와 Wilk에 의해 제안된 정규성 검정방법으로 정규 분포로 추출된 표본  ⋯이 귀무가설을 따르는지를 점검하며, 검정 통계는 식 (6)과 같다(Wikipedia, 2018d).

 

  

 

  



(6)

여기서,

 : SW 값

 : i번째 차수 통계치, 예를 들면 표본에서 i번째 최솟값

 : 표본의 평균

:  ⋯     

 

여기서, m = (m1, …, mn)T을 의미하고, m1, …, mn 은 표준 정규분포로부터 추출된 확률변수의 순서 통계의 기댓값을 V 는 순서 통계의 공분산 행렬이다.

SW test의 귀무가설은 모집단이 정규분포를 따른다는 것이다.

과 의 결과에 따라   가 선정되고, 선정된   가 값의 수 준보다 작으면 기무가설은 기각되고, 정규분포를 따르지 않는다는 대립가설이 성립된다. 반면에   가 선정된 값의 수준보다 높으면 귀무가설이 채택 되어, 정규분포를 보인다고 할 수 있다.

ND 평가를 위하여 본 연구에서는 IBM사의 SPSS Statistics 프로그램 Version 22.0을 사용하였다. SPSS 프로그램은 앞서 설명한 KS test 및 SW test를 동 시에 모두 지원하지만 앞서 설명한 대로 본 연구에서는 SW test를 ND 평가 방법으로 선택하였다. 본 연구에서의   는 0.05를 기준으로 하였으며, 그에 따른 귀무가설과 대립가설은 다음과 같다.

귀무가설 H0 : 표본이 정규분포를 따른다.

대립가설 H1 : 표본이 정규분포를 따르지 않는다.

앞서 설명한 바와 같이    ≥ 0.05이면, 귀무가설이 채택되어 정규분 포를 따르는 것이고,   〈 0.05이면, 귀무가설이 기각되고 대립가설이

채택되어 정규분포를 따르지 않는 것으로 하였다. Table 24는 ND Test의 한 예 이다.

Ship Size

Busan No.1 route inbound 1st gate line

     가설 성립여부

Small .967 61 .095 H0

Medium .794 44 .000 H1

Large .976 3 .701 H0

Table 24 Example of ND test result