저작자표시-비영리-변경금지 2.0 대한민국 이용자는 아래의 조건을 따르는 경우에 한하여 자유롭게
l 이 저작물을 복제, 배포, 전송, 전시, 공연 및 방송할 수 있습니다. 다음과 같은 조건을 따라야 합니다:
l 귀하는, 이 저작물의 재이용이나 배포의 경우, 이 저작물에 적용된 이용허락조건 을 명확하게 나타내어야 합니다.
l 저작권자로부터 별도의 허가를 받으면 이러한 조건들은 적용되지 않습니다.
저작권법에 따른 이용자의 권리는 위의 내용에 의하여 영향을 받지 않습니다. 이것은 이용허락규약(Legal Code)을 이해하기 쉽게 요약한 것입니다.
Disclaimer
저작자표시. 귀하는 원저작자를 표시하여야 합니다.
비영리. 귀하는 이 저작물을 영리 목적으로 이용할 수 없습니다.
변경금지. 귀하는 이 저작물을 개작, 변형 또는 가공할 수 없습니다.
1
의학석사 학위논문
Legg-Calvè-Perthes 병에서 변형 외측주 분류법의 관찰자내 및 관찰자간 신뢰도:
개선된 분류 기준의 유용성
Intra and interobserver reliability of the modified lateral pillar classification in Legg-Calvè-Perthes
disease: Usefulness of the refined criteria
2015 년 6 월
서울대학교 대학원 의학과 석사 과정
이 동 오
2
국문 초록
목적: LCP 병에서 예후 판단에 도움이 되는 단순 전후방 사진을 이용하는 Herring의 변 형 외측주 분류법은 현재까지도 널리 쓰고 있으나, 이 분류법은 그간 관찰자간 및 관찰 자내 신뢰도가 높지 않게 보고 되고 있다. 본 연구의 주목적은 저자가 고안한 보다 개선 된 분류 기준들을 적용할 경우, Herring 의 변형 외측주 분류법의 신뢰도를 높일 수 있 는지 평가해 보고자 하는 것이다. 부차적인 목적으로, 측방 사진을 이용하여 후측주 및 성장판 이환 정도도 함께 감안하여 평가하였을 때 신뢰도를 더 높일 수 있는지도 조사하 고자 하였다.
대상 및 방법: 1985년 12월부터 2012년 3월까지 서울대 소아병원에 내원한 1321명 중, 편측 LCP 병으로 확진된 분절기 방사선 사진이 있는 총 36 명의 환아를 대상수 산출 및 무작위 추출하였다. 환자의 증상 발현시 평균 연령은 6.8세(범위, 2~9.4)였고, 평균 추시 기간은 4.4년 (범위, 1~12년) 이었다. 조기내지 중기 분절기 (fragmentation stage)의 양측 고관절 전후방 및 측방 방사선 사진을 세 명의 스태프와 두 명의 전임의 가 평가하였다. 제1단계에서는 기존의 변형된 외측주 분류를, 제2단계에서는 보다 개선 된 저자의 분류 기준법을 교육한 후 시행한 외측주 분류를, 제3단계에서는 측방 사진상 의 성장판 이환 정도와 후측주 분류를, 그리고 제4단계에서는 전후방 및 측방 영상 모두 를 참고하여 Herring의 변형 외측주 분류를 각각 최소 2주 이상의 간격으로 두 번씩 반 복 평가하였다. 각 단계에서의 관찰자간 및 관찰자 내 신뢰도를 비교하기 위해 weighted kappa 값 및 불일치도를 구하였다.
3
결과: 관찰자간의 신뢰도(weighted kappa)는 제1단계는 0.221~0.805, 제2단계는 0.492~0.807, 제3단계의 성장판 평가는 0.095~0.843 및 후측주 평가는 0.194~0.798 이었으며, 제4단계의 신뢰도는 0.426~0.764 이었다. 조사한 각 단계간의 비교에서, 관 찰자내 불일치도는 제4단계에서 가장 낮았으나 통계학적으로 제2단계보다 유의하게 낮 지는 않았다. 한편, 관찰자간 불일치도는 제2단계에서 가장 낮았고 그 다음으로 제4단계 가 낮았으나, 그 차이 역시 유의하지는 않았다.
결론: Herring의 변형 외측주 분류는 저자의 개선된 분류 기준법의 경우, 기존의 분류법 에 비하여 관찰자내 신뢰도는 향상된다. 측방 영상의 경우, 전후방 및 측방 방사선 영상 을 함께 참고하여 평가 한다 하더라도 신뢰도를 더 향상시키지는 않는다.
--- 주요어: 고관절, LCP 병, 외측주 분류, 신뢰도
학 번: 2013-21685
4
List of Table
Table 1. Original modified LP classification and the modified LP classification according to the refined criteria
Table 2. Rater’s agreement on the modified lateral pillar classification according to the phase of assessment
Table 3. Summary of intraobserver reliability (weighted κ value)
Table 4. Summary of the 1stphase(original modified lateral pillar classification):
intra- and interobserver reliability (κ value)
Table 5. Summary of the2nd phase (modified lateral pillar classification using the refined criteria: intra- and interobserver reliability (κ value)
Table 6.Summary of the 3rd phase (grading of growth plate involvement): intra- and interobserver reliability (κ value)
Table 7. Summary of the3rd phase(grading of posterior pillar classification): intra- and interobserver reliability (κ value)
Table 8. Summary of the 4th phase (modified lateral pillar classification using the refined criteria plus grading of physeal involvement and posterior pillar involvement): intra- and interobserver reliability (κ value)
Table 9. Summary of intraobserver reliability (mean and SD of disagreement) Table 10. Interobserver reliability: (mean and SD of disagreement)
5
List of Figures
Figure 1.Lateral pillar A according to the refined criteria. Lateral pillar height of the epiphysis is well-maintained. Outer sclerotic margin of the lateral pillar and subphyseal sclerotic line of the epiphysis are intact. There is little radiolucency inside the lateral pillar.
Figure 2. Lateral pillar B according to the refined criteria. (1) Lateral pillar height of the epiphysis is more than 50%. Outer sclerotic margin of the lateral pillar is intact. There is some radiolucency inside the lateral pillar. (2) Subphyseal sclerotic line of the epiphysis is preserved.
Figure 3. Lateral pillar B/C border according to the refined criteria. (A) Lateral pillar height maintained but very narrow pillar (2~3mm): falciform-shaped viable lateral pillar (arrow). Outer sclerotic margin is distinct. Subphyseal sclerotic line is disrupted. (B) and (C) Lateral pillar height is at least 50%. There is very little ossification inside the lateral pillar (arrow). Outer sclerotic margin is indistinct. (D) Lateral pillar height is exactly 50% of original epiphyseal height. However, there is mixed sclerosis and radiolucency inside the epiphysis of the lateral pillar. There is no collapse of central part: lateral pillar is depressed relative to central pillar.
Figure 4. Lateral pillar C according to the refined criteria. Lateral pillar height is less than 50%, sometimes showing cocked hat deformity (arrow).
Figure 5. Grading of growth plate involvement of the proximal femur. The extent of involved growth plate was determined according to several factors, i.e. site of disruption, extent of irregularity, widening, proximal convexity, but seemingly not associated with metaphyseal cyst location.
Figure 6. Grading of posterior pillar involvement. The posterior pillar classification assesses 15% to 30% of the femoral epiphysis according to the same criteria as those of the original lateral pillar classification. In this radiograph, the height of the posterior column is between 50% and 100% of the original height.
6
목 차
서 론……….
연구 대상 및 방법……….
결 과………
고 찰………
결 론………
참고문헌……….
Abstract………
7
서론
Legg-Calve-Perthes 병 (이하 LCP 병) 은 소아기에 대퇴 골두 혈류의 장애로 인해 골단의 무혈성 괴사가 발생하는 질환으로서, 이후 자연 관해 되는 과정에서 골두 및 비 구의 변형이 일어나 40~60 세 이후 조기 골관절염을 일으킬 수 있다는 점에서 중요한 병이다.1) 그러나 100여년 전 이 병이 처음 소개된 이후로 많은 연구가 이루어져 왔음에 도 불구하고 아직 확실한 원인이나 분류 방법, 치료시기, 치료 방침 등에 대하여 상당한 이견이 남아 있는 상태이며, 또 이로 인해 상당 부분에서 경험적인 치료가 이루어지고 있는 실정이다.1-8)
이러한 특성에 더하여, LCP 병은 질병의 이환이 끝나고 난 뒤 대개의 환아가 정상 생 활을 영위하게 된다는 주장에서부터 대부분의 경우에 예후가 좋지 않다는 연구까지 다양 한 의견이 발표되어 왔다. 그러나 한가지 분명한 것은, 전체 환자 중 대퇴 골두 및 비구 의 변형으로 인해 이차성 관절염의 조기 발현이 일어나 그 예후가 좋지 않은 특정 환자 군이 존재한다는 것이다. 따라서 임상 의사에게 이 병의 정확한 예후를 판단하기 위한 요소들을 밝혀내는 것은 아주 중요하며,9) 이에 지금까지 LCP 병의 예후 인자들을 규명 하고자 하는 다양한 연구들이 보고되었다.
LCP 병의 예후에 영향을 미칠 수 있는 인자는 다양한데, 물리치료, 보조기, 석고고정을 포함한 보존적 치료법과 대퇴 내전 절골술, 외전 절골술, 회전 절골술 및 골반 Salter 절 골술, Pemberton 절골술, 삼중 무명골 절골술, 선반 비구 성형술, Chiari 절골술 등의 다 양한 수술적 치료법을 포함한 치료 방법에서부터 성별, 발병시의 연령, 방사선학적 소견 등을 포함하고 있다.6, 10-18) 이중, 방사선학적 소견에 대해서는 역사적으로 몇 가지의 방 사선학적 분류법이 개발, 발전되어 왔는데 Catterall 분류법, Salter-Thompson 분류법 등이 소개되었으나 현재는 전후방 단순 방사선 영상만으로 판정하는 변형 외측주 분류
8
(modified lateral pillar classification)가 널리 쓰이고 있는 실정이다.19, 20)
따라서, LCP 병의 진단과 치료 방법 및 시기를 결정하기 위해 널리 쓰이는 변형 외측 주 분류의 관찰자내 및 관찰자간 신뢰도, 그리고 예후를 예측하는 타당도가 높아야 할 것이다. 그러나 실제로 임상적으로는, 질병의 예후가 서로 달라질 수 있다는 점에서 중 요함에도 불구하고, 변형 외측주 분류에 있어서 B형과 B/C형, 그리고 B/C형과 C형을 구분하는 것이 수월치 않다. 현재까지 변형 외측주 분류의 관찰자내 및 관찰자간 신뢰도 에 대한 보고는 별로 없는데, 최근의 보고에 의하면 신뢰도가 높지 않았다.9)
이에 저자는 변형 외측주 분류 시, 외측주의 특성을 보다 체계적으로 파악하게 하는 소 견들을 모아서 판단 기준을 개발하였다. 본 논문의 주목적은 보다 개선된 새로운 판단 기준들을 적용하여 변형 외측주 분류를 할 때, 과연 관찰자내 및 관찰자간의 신뢰도가 높아지는지 알아 보고자 하는 것이다. 부차적인 목적으로, 측방 사진을 이용하여 후측주 및 성장판 이환 정도도 함께 감안하여 평가하였을 때 신뢰도를 더 높일 수 있는지도 검 증하고자 하였다.
연구 대상 및 방법 연구 대상
이 연구는 의무 기록과 방사선 자료를 이용한 후향적 연구이다. 1985 년 12 월부터 2012 년 3 월까지 서울대학교 어린이 병원에서 LCP 병으로 진단 받고 치료를 받은 환 아는 총 1321 명 이었다. 이들 중에서 양측 고관절이 이환된 환아나 첫 방문시에 이미 잔여기에 다다른 경우, 스테로이드 치료를 받거나 감염, 다발성 골단 이형성증, 갑상선 기능 저하증, 당뇨나 그 외의 대사성 질환, 신부전 증 등의 과거력이 있는 경우, 의무기
9
록이나 방사선 사진이 미비한 경우, 그리고 충분한 데이터 확보가 불가능한 경우를 제외 하였다.그 다음에 적절한 의무기록과 방사선 영상이 보관된 환자들 중에서 무작위로 36 명을 추출하여 연구 대상으로 삼았다. 이들의 발병 연령은 평균 6.8세 (범위 2~9.4세), 첫 내원시 평균 연령은 7.3세 (범위 3~10세) 였고, 평균 추시 기간은 4.4년 (범위 1~12년) 이었다. 남아는 33명 (91.7%), 여아는 3명 (8.3%)이었다. 모집단의 경우 1145명 (86.7%)이 남아, 176명 (13.3%)이 여아로, 두 집단의 성별 구성에 유의한 차 이는 없었다(p =0.615). 36개의 방사선 영상에서 30례는 중기 분절기, 6례는 조기 분절 기에 해당되는 소견을 보였다.
방사선학적 분류법
외측주 분류는 이미 보고된 대로 분절기에 촬영된 전후방 양측 고관절 방사선 영상에 서 평가하였다2). 저자는 조기내지 중기 분절기 전후 3개월 안에 촬영된 단순 방사선 영상을 추가로 확인하고 비교하여 이 안에서 더 선명한 영상을 사용하였다.2) 이 연구에 서 관찰자내 및 관찰자간의 신뢰도를 조사하고자 사용된 분류법은 총 다섯 가지이다.
즉, 기존의 변형 외측주 분류법과 저자가 고안한 개선된 방사선학적 기준을 적용시킨 변형 외측주 분류법(Table 1), 측방 단순 방사선 영상에서 평가한 성장판 및 후측주 (posterior pillar)침범을 등급화한 분류법 및 전후방 및 측방 영상모두를 종합적으로 판단한 개선된 변형 외측주 분류법이다. 기 보고된 원래의 변형 외측주 분류를 이용하 는 첫 번째 조사가 끝난 다음에 연구에 참여한 관찰자들 5명이 모두 모여, 저자의 개선 된 외측주 분류를 위한 판단 기준이 되는 지침 소견(Table 1, Figures 1,2,3,4)들에 대 한 충분한 토의와 교육 시간(약 30분 이상)을 가졌다. 특히, 세 번째 단계에서는, Akazawa 등이 제안한 단순 방사선 측면 영상에서 관찰되는 후측주는 전체 성장판의
10
15~30% 뒤편에서 반대편과 비교한 골단의 상대적인 높이에 따라 100%, 50~100%, 50% 미만으로 나누어 분류하였으며21, 22) 이를 각각 0점, 0.5점, 1점으로 평가하였다.
(Figure 5) 여기에 덧붙여 Domzalski 등이 제안한 대로 대퇴 근위부 성장판의 이환 정도를 역시 단순 방사선 측면 영상에서 평가하였다23). 성장판의 이환 여부는 성장판과 맞닿는 골단 골경화선 (epiphyseal sclerotic line)의 온전함의 여부, 성장판 윤곽선의 불규칙, 성장판 너비의 확대, 근위 볼록함 등을 종합적으로 관찰하여 침범 정도를 파악 하였다. 이때, 골간단 낭포(metaphyesal cyst)의 존재 여부는 평가시에 고려치 않았다.
이렇게 평가하였을 때, 전체 성장판을 3등분하여 이환 정도가 전방부 1/3 이하일 때 0.5점, 중간부까지 이환이 되었을 때 1점, 후방부까지 이환이 되었을 때 2점으로 평가 하였다. (Figure 6)
마지막으로 제4단계에서는, 전후방 및 측방 영상 모두를 이용하여 변형 외측주 분류를 시행하였다.
방사선학적 평가 방법
방사선학적 평가는 총 4단계에 걸쳐서 이루어졌는데, 각 단계에서 10 년 이상의 경험 을 가지고 있는 3명의 소아 정형외과 스태프와 3년 미만의 경험을 가진 2명의 전임의 가 최소 2주간의 간격을 두고 총 두 번씩 반복 평가 하였고, 단계간에도 최소 2주 이상 의 간격을 두었다. 제1단계는 기존의 외측주 분류에 대해서 5명의 관찰자가 측정하였다.
제2단계는 저자가 개선한 분류 지침을 숙지하도록 관찰자들에게 내용을 강의한 뒤 다 시 영상을 판정하도록 하였고, 제3단계를 넘어갈 때 촬영 사진의 순서는 무작위로 바꾸 어서 평가하도록 하였다. 이 단계에서는 고관절 측면 단순 방사선 영상을 관찰자들에게 보여주고 각각의 후측주 분류와 성장판 이환 정도를 평가하도록 하였으며, 제4단계에서
11
는 단순 전후방 방사선 영상과 단순 측면 방사선 영상 사진을 모두 관찰자들에게 보여 주었다. 이때 제2단계와 제3단계에서 사용하였던 분류 기준을 참고하여, 상기 기술했던 바와 같이 판정할 수 있도록 하였다.
통계 분석
모집단과 연구집단의 성별 분포 비교는 Fisher’s exact test 로 검정하였다. 각 관찰 자에서 첫 번째 평가 결과와 두 번째 평가 결과의 신뢰도를 보기 위해서 weighted kappa 를 추정하였고, 각 단계에서 관찰자간 신뢰도를 5명의 관찰자에서 가능한 모든 조합에 대해 weighted kappa 를 추정하였다.
각 단계의 신뢰도를 비교 시에 weighted kappa 를 사용할 수 없기 때문에, 모든 단계 에서 관찰된 점수를 0~6점으로 환산 및 통일한 다음, 한 단계 불일치의 정도가 다른 단 계들과 동일하게 점수화되도록 한 후 관찰자 내 진단값의 차이를 요약하였다.
관찰자 내 신뢰도의 경우, 관찰자 내에서 진단의 불일치 점수를 계산하여 단계에 따라 평균 및 표준편차로 요약하였다. 단계 간의 불일치 정도가 유의하게 다른지를 검정하기 위하여 진단 방법을 고정효과로, 영상과 관찰자를 무작위 효과로 하여 혼합모형 분석을 수행하였다. 관찰자간 신뢰도의 경우 한 영상의 특정 평가 시기 내에서 진단의 불일치 점수를 계산하였고, 단계에 따라 평균 및 표준편차로 요약하였다. 즉, 한 영상에서 시기 별로 관찰자에 따른 다섯 개의 진단 점수의 평균을 계산하였다. 한 영상에서 관찰자간 불일치 정도는 각 진단 점수와 위의 평균의 차이로 정의하였다. 각 진단점수와 그 평균 의 차이가 클수록 관찰자간 진단의 차이가 큼을 나타낸다. 단계별 불일치 정도가 유의하 게 다른지 검정하기 위하여 진단 방법, 평가 시기를 고정 효과로, 영상과 관찰자를 무작 위 효과로 하여 혼합 모형 분석을 수행하였다.
12
모든 통계 분석시에 R (ver 2.14.1) 과 SAS 9.2 version (SAS Institute Inc., Cary, NC, USA), OR-DBM 2.4 프로그램을 사용하였다.
결과
방사선학적 평가 분석
전체 36명의 자료 중 3명의 스태프의 평가 결과가 동일한 영상의 수와, 2명의 전임의 를 포함한 모든 관찰자의 평가가 동일한 영상의 수를 단계별로 요약하였으며, 두 번째 시기에 측정한 결과와 첫 번째 시기에 측정한 결과를 비교하였을 때, 두 번째 시기에서 일치하는 영상의 수가 항상 증가하는 것은 아니었다. 제1 단계, 제2 단계와 제4 단계에 서 모든 관찰자의 의견이 일치하는 영상의 수는 두 시기를 통틀어 평균 11.5 개로 전부 동일하였다. 스태프만의 평가 결과로는, 측면에서 평가한 후측주 높이에서 일치하는 영 상의 수가 평균 22.5개로 가장 많았고, 그 다음으로 많은 영상의 수를 기록한 분류는 개 선한 분류 지침의 외측주 평가로서, 평균 18개였다. (Table 2)
관찰자내 신뢰도: weighted kappa
각 관찰자 내에서 첫 번째 시기의 평가 결과와 두 번째 시기 평가 결과의 신뢰도를 보 기 위해 weighted kappa 를 추정하였다. (Table 3) 각 관찰자에서 제1단계와 제2단계 의 결과를 비교해보면, weighted kappa 가 증가한 관찰자와 감소한 관찰자도 있었으나 전체적으로는 weighted kappa 의 중앙값이 평균 0.714 에서 0.856으로 증가하였다.
단순 측면 방사선 영상을 평가한 제3단계의 결과는 전체적인 관찰자내 신뢰도가 성장 판 측정의 경우 평균 0.697, 후측주 평가의 경우 평균 0.763 이었다.
13
전후면 및 측면 단순 방사선 영상을 모두 참고하여 평가한 제4단계의 경우 weighted kappa 의 평균 중앙값은 0.875 (범위 0.67~0.983) 였다.
관찰자간 신뢰도: weighted kappa
관찰자간의 신뢰도를 알아보기 위해 5명의 관찰자에서 가능한 모든 조합에 대해 각각 의 단계별로 weighted kappa 를 추정하였다. (Table 4~ Table 7) 그 결과를 살펴보면, 제1단계 0.805, 제2단계 0.807, 제3단계 성장판 평가 0.843, 제3단계 후측주 평가 0.798, 제4 단계 0.764의 weighted kappa 값을 나타내었다.
관찰자내 신뢰도의 단계별 비교
Weighted kappa 값을 단계별로 비교할 수 없기 때문에 상기에서 기술한 바와 같이 모 든 단계에서 관찰된 점수를 0~6 점으로 변환한 뒤 관찰자 내 평가 값의 차이를 요약하 였다. (Table 9)
제3단계의 성장판 이환 평가법의 경우, 관찰자 내 불일치 정도가 평균 0.91으로 가장 컸다.이에 반하여 제4단계의 결과는 0.22 로 관찰자 내 불일치 정도가 가장 작았다. 단 계 별로 평가 방법에 따라 전반적인 불일치 정도는 유의하게 달랐으며(p<0.001), 이에 최종 제4단계의 결과를 다른 단계의 결과와 비교한 바, 제4단계 는 제1단계보다 불일치 도가 낮았다. (p=0.035) 또한 제4단계의 결과는 제3단계의 성장판 평가 (p<0.001)와 제3단계의 후측주 평가 (p=0.035) 보다 관찰자 내 불일치 정도가 유의하게 작았다. 그 리고 제4단계는 제2단계보다 불일치 정도는 작았지만 그 차이는 통계적으로 유의하지는 않았다. (p=0.552), (Table 9)
14
관찰자간 신뢰도의 단계별 비교
한 영상에서 첫 번째와 두 번째의 시기 별로 관찰자에 따른 다섯 개 평가 점수의 평균 을 계산하였다. 한 영상에서 관찰자 간의 불일치 정도는 각 평가 점수와 위에서 구한 평 균의 차이로 정의하였다. 각 평가 점수와 그 평균의 차이가 클수록 관찰자간 평가의 차 이가 크다는 것을 뜻한다.
관찰자간의 평가 차이 정도를 평가 방법인 단계별로 요약한 결과, 제3단계의 성장판 평 가 시 평균 1.32 로 관찰자간 불일치 정도가 가장 컸고, 제2단계에서 평균 0.49 로 관 찰자간 불일치 정도가 가장 작았다. (Table 10)
관찰자간의 불일치 정도가 평가 시기별로 차이가 있는지 검정하였으나 유의하지 않았고 (p=0.903), 평가 시기와 평가 방법 간의 교호 작용도 유의하지 않았다 (p=0.090). 따 라서 관찰자간 불일치 정도를 검정하기 위하여 평가 방법을 고정효과로 방사선 영상과 관찰자를 무작위 효과로 하여 혼합 모형 분석을 수행하였다. 관찰자간의 불일치 정도는 평가 방법에 따라 유의하게 달랐는데 (p<0.001), 제4단계는 제3단계의 두 가지 평가보 다 (p<0.001) 불일치 정도가 유의하게 작았고, 제1단계보다는 불일치 정도가 작은 경향 이 있으나 통계적으로 유의하지는 않았으며 (p=0.728), 제2단계보다는 관찰자간 불일 치 정도가 컸지만 유의한 차이는 아니었다 (p=0.728).
고 찰
LCP 병은 명확한 병인과 치료 방법 및 시기 등에 있어 아직 밝혀져야 할 부분이 많은 질환이다. 일단 발생하면, 수 년에 걸쳐 자연 관해 될 때까지 대퇴 골두 및 비구의 변형이 진행되는데, 이 변형 정도에 따라 무증상부터 조기 관절염으로 인한 수술적 치료까지 다양한 임상 경과를 가져오기 때문에 임상 의사로서는 환자를 마주했을 때
15
치료 시기와 방법을 결정하기 위해 가능하면 정확히 환자의 예후를 판단하는 것이 중요하다. Joseph 등 15)은 이러한 예후를 판단하기 위한 인자가 갖춰야 할 항목으로 신뢰도, 타당도와 조기에 그 인자를 얻을 수 있는가의 세가지 요소가 필요하다고 하였다.
그 예후 인자로 알려진 것은 다양한데, 발현시의 나이, 성별, 그리고 방사선 영상에서 확인할 수 있는 분류법들 등 여러 가지가 알려져 있다.
이중 방사선학적인 분류법에 대해서는 기존 연구에서도 그 예후를 정확히 예측하기 위한 여러 가지 분류들이 제시되어 왔고 24), 특히 Rajan 등은 바람직한 분류법이란 관찰자가 해당 분류법을 통해 빨리 그 단계를 정할 수 있어야 하며 신뢰성과 재현성 및 예후를 정확히 반영하는가를 모두 갖춰야 한다고 하였다.9) 여기에서 저자는 기존 연구 결과들을 바탕으로, 평가에 널리 쓰이고 있는 전후방 방사선 영상만이 아니라 측방 방사선 영상에서도 가치 있는 정보를 줄 수 있다고 가정하여 보았다.25, 26)Sugimoto 등21) 이 이미 외측주와 측방 영상으로 평가하는 후측주의 결합된 분류로서 복합 외측주 점수 (combined pillar score)를 제시한 바 있으나, 이는 변형 외측주 분류법이 나오기 이전의 최초로 보고된 외측주 분류법을 이용한 것이었기에 변형된 외측주 분류법을 사용할 경우에도 같은 결과가 나올지는 알 수 없다. 따라서 저자들은 변형 외측주 분류법을 적용시키는 전후방 영상뿐만 아니라 측방 영상에서 평가하는 성장판 분류와 후측주 평가도 포함시켜 보다 개선된 분류 지침의 효용성을 파악하고자 하였다.
이번 연구 결과에서 제 3 단계의 성장판 평가 분류가 관찰자내 불일치도와 관찰자간 불일치도 모두에서 모든 단계 중 제일 높았다. 즉, 측방 영상만을 가지고 판정한 분류가 가장 관찰자내 및 관찰자간의 신뢰도가 떨어졌는데, 이는 영상 분류의 익숙함이 상대적으로 전후방 영상만을 가지고 판단하는 분류보다 덜했기 때문으로 추측할 수 있다.
후측주 평가의 경우, 그 기준이 전후방 영상을 가지고 평가하는 원래의 외측주 평가와
16
비슷한 방식이기 때문에 더 쉽고 익숙하여 성장판 평가 분류보다 그 불일치 정도가 덜했을 것으로 판단된다.
금번 연구에서 새로이 시도했던 여타 단계의 분류들과 달리 제 2 단계 즉, 보다 개선한 분류 지침으로 교육을 받은 뒤 시행한 저자의 분류법이 가장 높은 weighted kappa 값(0.807)이 스태프들 사이에서 산출된 신뢰도라는 점은, 분류의 주체인 임상 의사의 경험이 신뢰도를 높이는 데 있어 매우 중요한 요소임을 다시 한번 상기시킨다. Wiig 등 27) 역시 과거 영상학적 분류법들을 비교시, 경험이 많은 관찰자와 적은 관찰자 사이의 결과가 다름을 보고하였었다.
한편, 전후방 방사선 영상과 측면 방사선 영상을 모두 고려한 제 4 단계의 외측주 분류 결과가 전체적으로는 관찰자내 불일치도가 가장 작았으나, 제 2 단계의 결과에 비해 유의하게 작지는 않았다. 또한 관찰자간의 불일치도도 제 4 단계와 제 2 단계 사이에는 통계학적인 유의한 차이가 없었는데, 저자의 개선된 외측주 분류법이 유용하다는 것을 시사한다고 여겨진다.
예측도와 신뢰도를 판정할 때 Herring 등 2)이나 Walter 등 28)은 영상의 다양성이나 관찰자의 집중도 및 피로도를 감안하여 20 여개의 영상을 사용하였고, 이 정도의 영상 개수가 최적이라고 주장하였다.29) 최근 변형된 외측주 분류의 신뢰도를 다룬 Rajan9) 등은 35 개의 영상을 사용하였는데, 본 연구 역시 36 명의 환자군을 대상으로 관찰하였으며 저자들은 이를 통해 최대한의 영상 다양성을 얻으면서도 관찰자들의 집중도와 피로도에 방해가 되지 않기 위해 2 주 이상의 평가 간격을 두고 단순 방사선 영상의 순서를 무작위로 뒤섞는 등, 연구 결과의 객관성을 더 높이려고 노력하였다.
17
저자의 연구에서도 밝혀졌듯이 기존의 외측주 분류법은 일부 보고 9)에서 지적한 바와 같이 만족스러운 일치도 및 예후 예측도를 보여주지 못하였다. 변형 외측주 분류법을 발표한 Herring 등의 연구에서는 관찰자들에게 10 분간의 교육을 실시한 후 방사선 영상을 평가하여 만족스러운 weighted kappa 값을 얻었다고 보고하였다. 이에 반하여, 최근 Rajan 등은 1 시간여의 교육에도 Herring 등이 보고한 만큼의 좋은 신뢰도를 얻을 수 없었다고 보고하였다. 본 연구에서도 변형 외측주 분류는 비록 보다 개선된 분류 지침을 이용한다 하더라도 관찰자내 신뢰도는 높일 수 있었으나 관찰자간 신뢰도는 높이는 데는 어느 정도 한계가 있음을 알게 되었다. 따라서 임상적으로 치료 방법의 선택이나 예후 판정에 결정적인 인자인 외측주의 분류를 위해서는 보다 더 정확하고 유용한 정보를 담고 있는 검사법, 예컨대 자기 공명 영상 검사, 등을 이용한 새로운 삼차원적인 분류법이 필요하다고 생각한다.
본 연구는 몇 가지의 한계점과 개선해야 할 사항을 가지고 있다. 첫 번째로, 본 연구의 대상 환자군에는 추시 도중에 수술적 치료를 받은 환아와 보존적 치료만을 받은 환아가 섞여있었으며, 남녀 성별이나 발병 연령 등 기존에 알려진 예후 인자를 모두 통일시키지 않았다. 즉, 균일한 환자군을 대상으로 하지 않았기 때문에 본 연구에서 제시한 여러 가지 방사선학적 분류법의 타당도(validity)를 분석 및 비교할 수 없었다. 연구 대상 환자군이 다양한 혼란 변수를 내포하고 있어 Stulberg 분류를 포함한 방사선학적인 분류뿐 아니라 다른 어떤 결과 지표를 사용하더라도 온전히 방사선학적 분류에 의한 예후를 반영하지 못하였을 것이다. 그러나 균일한 환자군을 동일한 병기 별로 나누어 치료 방법을 통일하고 그 예후를 관찰하는 것은 후향적이든 전향적이든 간에 윤리적인 문제 혹은 현실적인 문제로 어려운 일이다. 때문에 향후 이를 더 보완한 연구설계가 필요하다. 두 번째로, 측방 단순 방사선 영상에서의 두 가지 분류법이 관찰자들에게
18
비교적 생소하였기 때문에 이에 대한 교육을 했다 하더라도, 오랜 기간 관찰자들에게 익숙했던 기존의 외측주 분류법과의 절대적인 비교는 어려울 수 있었다. 특히 성장판 이환 정도를 평가하는 데 있어서 관찰자 내 및 관찰자 간의 신뢰도가 특히 낮았기 때문에 향후 이에 대한 충분한 교육과 숙지를 통해 같은 연구를 다시 수행한다면 더 나은 결과가 나올 수 있을 가능성은 배제할 수 없다.
결 론
변형된 외측주 분류 시, 저자가 고안한 개선된 방사선 기준 소견을 감안한 변형 외측주 분류법은 의미있는 관찰자내 신뢰도 향상을 보였으나 관찰자간 신뢰도의 차이는 없었다.
한편 측방 방사선 영상은 그 자체, 혹은 기존의 분류와 함께 사용해도 신뢰도 향상에 뚜렷한 도움을 주지 못했다.
19
참 고 문 헌
1. Joseph B, Varghese G, Mulpuri K, Narasimha Rao KNair N S, Natural evolution of
Perthes disease: a study of 610 children under 12 years of age at disease onset. J Pediatr Orthop, 2003. 23(5): 590-600.
2. Herring J A, Kim H TBrowne R, Legg-Calve-Perthes disease. Part I: Classification of radiographs with use of the modified lateral pillar and Stulberg classifications. J Bone Joint Surg Am, 2004. 86-A(10): 2103-20.
3. Nguyen N A, Klein G, Dogbey G, McCourt J BMehlman C T, Operative versus nonoperative treatments for Legg-Calve-Perthes disease: a meta-analysis. J Pediatr Orthop, 2012. 32(7): 697-705.
4. Stulberg S D, Cooperman D RWallensten R, The natural history of Legg-Calve- Perthes disease. J Bone Joint Surg Am, 1981. 63(7): 1095-108.
5. Ippolito E, Tudisco CFarsetti P, The long-term prognosis of unilateral Perthes' disease. J Bone Joint Surg Br, 1987. 69(2): 243-50.
6. Wiig O, Terjesen TSvenningsen S, Prognostic factors and outcome of treatment in Perthes' disease: a prospective study of 368 patients with five-year follow-up. J Bone Joint Surg Br, 2008. 90(10): 1364-71.
7. Joseph B, Rao N, Mulpuri K, Varghese GNair S, How does a femoral varus osteotomy alter the natural evolution of Perthes' disease? J Pediatr Orthop B, 2005.
14(1): 10-5.
8. Terjesen T, Wiig OSvenningsen S, The natural history of Perthes' disease. Acta Orthop, 2010. 81(6): 708-14.
9. Rajan R, Chandrasenan J, Price K, Konstantoulakis C, Metcalfe JJones S, Legg- Calve-Perthes: interobserver and intraobserver reliability of the modified herring
20
lateral pillar classification. J Pediatr Orthop, 2013. 33(2): 120-3.
10. Herring J A, Kim H TBrowne R, Legg-Calve-Perthes disease. Part II: Prospective multicenter study of the effect of treatment on outcome. J Bone Joint Surg Am, 2004. 86-A(10): 2121-34.
11. Kim H K, Legg-Calve-Perthes disease: etiology, pathogenesis, and biology. J Pediatr Orthop, 2011. 31(2 Suppl): S141-6.
12. Sharma S, Sibinski MSherlock D A, A profile of Perthes' disease in Greater Glasgow:
is there an association with deprivation? J Bone Joint Surg Br, 2005. 87(11): 1536- 40.
13. Kamegaya M, Saisu T, Miura YMoriya H, A proposed prognostic formula for Perthes' disease. Clin Orthop Relat Res, 2005. 440: 205-8.
14. Farsetti P, Tudisco C, Caterini R, Potenza VIppolito E, The Herring lateral pillar classification for prognosis in Perthes disease. Late results in 49 patients treated conservatively. J Bone Joint Surg Br, 1995. 77(5): 739-42.
15. Joseph B, Prognostic factors and outcome measures in Perthes disease. Orthop Clin North Am, 2011. 42(3): 303-15, v-vi.
16. Canavese FDimeglio A, Perthes' disease: prognosis in children under six years of age. J Bone Joint Surg Br, 2008. 90(7): 940-5.
17. Schoenecker P L, Stone J WCapelli A M, Legg-Perthes disease in children under 6 years old. Orthop Rev, 1993. 22(2): 201-8.
18. Fabry K, Fabry GMoens P, Legg-Calve-Perthes disease in patients under 5 years of age does not always result in a good outcome. Personal experience and meta- analysis of the literature. J Pediatr Orthop B, 2003. 12(3): 222-7.
19. Ritterbusch J F, Shantharam S SGelinas C, Comparison of lateral pillar classification and Catterall classification of Legg-Calve-Perthes' disease. J Pediatr Orthop, 1993.
21 13(2): 200-2.
20. Park M S, Chung C Y, Lee K M, Kim T WSung K H, Reliability and stability of three common classifications for Legg-Calve-Perthes disease. Clin Orthop Relat Res, 2012. 470(9): 2376-82.
21. Sugimoto Y, Akazawa H, Miyake Y, et al., A new scoring system for Perthes' disease based on combined lateral and posterior pillar classifications. J Bone Joint Surg Br, 2004. 86(6): 887-91.
22. Akazawa H, Miyake Y, Nagasawa F. , Posterior pillar classification of Perthes’
disease. J Jpn Paed Orthop Ass, 2000. 9: 212-15.
23. Domzalski M E, Inan M, Guille J T, Glutting JKumar S J, The proximal femoral growth plate in Perthes disease. Clin Orthop Relat Res, 2007. 458: 150-8.
24. Kim H T, Woo S H, Jang J H, Lee S G, Kim H KBrowne R, What is the usefulness of the fragmentation pattern of the femoral head in managing Legg-Calve-Perthes disease? Clin Orthop Surg, 2014. 6(2): 223-9.
25. Yoo W J, Choi I H, Cho T J, Chung C Y, Park M SLee D Y, Out-toeing and in-toeing in patients with Perthes disease: role of the femoral hump. J Pediatr Orthop, 2008.
28(7): 717-22.
26. Yoo W J, Choi I H, Chung C Y, Cho T JKim H Y, Valgus femoral osteotomy for hinge abduction in Perthes' disease. Decision-making and outcomes. J Bone Joint Surg Br, 2004. 86(5): 726-30.
27. Wiig O, Terjesen TSvenningsen S, Interobserver reliability of radiographic classifications and measurements in the assessment of Perthes' disease. Acta Orthop Scand, 2002. 73(5): 523-30.
28. Walter S D, Eliasziw MDonner A, Sample size and optimal designs for reliability studies. Stat Med, 1998. 17(1): 101-10.
22
29. Donner AEliasziw M, Sample size requirements for reliability studies. Stat Med, 1987. 6(4): 441-8.
23
Abstract
Intra and interobserver reliability of the modified lateral pillar classification:
Usefulness of the refined criteria
Dong-Oh Lee Department of Pediatric Orthopedic Surgery Seoul National University School of Medicine,
Seoul, Korea
Purpose: Modified lateral pillar classification has been widely used for diagnosing LCP disease and for predicting the prognosis of the disease. However, the classification system was reported to show lower intra-and interobserver reliability than expected. Therefore, we examined whether intra- and interobserver reliability could be improved by the use of the refined criteria or additional lateral radiographs.
Materials and methods: From December 1985 to March 2012, 1321 patients visited our institution and were diagnosed as LCP disease. Thirty six patients with unilateral LCP disease who met the inclusion criteria were randomly selected.
Medical records and radiographs were retrospectively reviewed. The mean age at onset in 36 patients was 6.8 years (range, 2 to 9.4) years, and the mean follow-up period was 4.4 years (range, 1 to 12). Intra- and interobserver reliability test for
24
modified lateral pillar classification was conducted by three full time staffs and two fellows. In the first phase, lateral pillar types were determined according to original modified lateral pillar classification. In the second phase, lateral pillar types were determined with use of the refined criteria. In the third phase, lateral radiographs were evaluated to determine the extent/grading of involvement of the growth plate and posterior pillar. In the fourth phase, lateral pillar type was determined based upon the observations made on anteroposterior and lateral radiographs. To calculate intra- and interobserver reliability, examination in each phase was repeated at least two weeks apart between the test and retest. Statistically, weighted kappa and the degree of disagreement were calculated to determine the reliability.
Results: In the first phase, the weighted kappa values for each pairing of the observers ranged from 0.221 to 0.805. In the second phase, the kappa ranged from 0.492 to 0.807. In the third phase, the weighted kappa of growth plate involvement classification ranged from 0.095 to 0.843 and that of posterior pillar classification ranged from 0.194 to 0.798. In the 4th phase, the weighted kappa values ranged from 0.426 to 0.764. The best interobserver reliability was observed at the second phase, followed by fourth phase, however, no statistical significance between the two.
Conclusion: Intraobserver reliability of modified lateral pillar classification significantly increased, but not interobserver reliability, when lateral pillar type was determined according to the refined criteria. However, even when taking into
25
consideration of the extent of involvement of growth plate and posterior pillar, the reliability of the modified lateral pillar classification could not be improved.
--- Key Words: hip, LCP disease, lateral pillar classification, reliability Student number: 2013-21685
26
Table 1. Original modified LP classification and the modified LP classification according to the refined criteria
Type of LP Original Modified LP classification Modified LP classification according to the refined criteria
A No involvement of the LP*
1)LP height of the epiphysis (15
~30%): well-maintained
2)Intact outer sclerotic margin of the LP
3)Intact subphyseal sclerotic line of the epiphysis
4)Little radiolucency inside the LP
B LP at least 50% of its height
1) LP height : at least 50%
2) intact sclerotic outer margin 3) Subphyseal sclerotic line of the epiphysis is preserved
4) The presence of some radio- lucency inside the LP
B/C
1)a very narrow pillar
(2-3 mm wide) that is >50% of the original height
2)a LP with very little ossification, but with at least 50%of the original height
3)a LP with exactly 50% of the original height that is depressed relative to the central pillar
1) LP height maintained but very narrow pillar (2-3 mm):
falciform-shaped viable LP
2) Indistinct outer sclerotic margin or very little ossification inside the LP
3) LP height : exactly 50% of the original epiphyseal height with no collapse of central part
4) Subphyseal sclerotic line of the epiphysis is disrupted
5) Mixed sclerosis and radio- lucency inside the epiphysis of the LP
27 C A loss of more than 50% of the
original height of the LP
1) LP height : less than 50%, sometimes showing cocked hat deformity
2) Indistinct sclerotic outer margin 3) Subphyseal sclerotic line of the epiphysis is disrupted
4)Mixed sclerosis and radio- lucency inside the remaining epiphysis of the LP
*means lateral pillar
28
Table 2. Rater’s agreement on the modified lateral pillar classification according to the phase of assessment
Phase Number of hips assessed 1st period 2nd period
1st
Staff's agreement 36 17 12
All agreement 36 14 9
2nd
Staff's agreement 36 19 17
All agreement 36 12 11
3rd(GP)
Staff's agreement 36 15 17
All agreement 36 8 9
3rd(PP)
Staff's agreement 36 19 26
All agreement 36 11 11
4th
Staff's agreement 36 16 17
All agreement 36 12 11
GP: growth plate grading, PP: posterior pillar grading
29
Table 3. Summary of intraobserver reliability (weighted κ value)
Phase
Reviewer
A B C D E
1st
weighted kappa (95% CI*)
0.917 [0.838,0.9
96]
0.234 [- 0.046,0.515
]
0.929 [0.791,1]
0.7 [0.514,0.88
6]
0.792 [0.62,0.963
]
#(agreement)/to
tal 30/36 17/36 35/36 27/36 28/36
2nd
weighted kappa (95% CI)
0.9 [0.807,0.9
93]
0.886 [0.754,1]
0.806 [0.678,0.93
3]
0.739 [0.542,0.93
6]
0.948 [0.89,1]
#(agreement)/to
tal 30/36 31/36 28/36 27/36 33/36
3rd (GP)
weighted kappa (95% CI)
0.743 [0.56,0.92
6]
0.843 [0.696,0.98
9]
0.913 [0.816,1]
0.671 [0.49,0.852
]
0.316 [- 0.021,0.653
]
#(agreement)/to
tal 27/36 28/36 31/36 22/36 24/36
3rd(PP )
weighted kappa (95% CI)
0.952 [0.859,1]
0.629 [0.398,0.86
]
0.69 [0.382,0.99
8]
0.786 [0.555,1]
0.757 [0.586,0.92
7]
#(agreement)/to
tal 35/36 25/36 31/36 33/36 29/36
4th
weighted kappa (95% CI)
0.953 [0.897,1]
0.953 [0.899,1]
0.817 [0.692,0.94
3]
0.67 [0.446,0.89
5]
0.983 [0.95,1]
#(agreement)/to 33/36 33/36 28/36 26/36 35/36
30 tal
*means confidence interval, GP: growth plate grading, PP: posterior pillar grading
31
Table 4. Summary of the 1st phase(original modified lateral pillar classification):
intra- and interobserver reliability (κ value)
A1 A2 B1 B2 C1 C2 D1 D2 E1 E2
A1 1 0.917 0.606 0.221 0.444 0.6 0.771 0.5 0.662 0.645 A2 1 0.663 0.256 0.457 0.62 0.715 0.515 0.657 0.644
B1 1 0.234 0.571 0.639 0.637 0.615 0.62 0.532
B2 1 0.328 0.403 0.311 0.491 0.349 0.286
C1 1 0.929 0.563 0.692 0.737 0.63
C2 1 0.746 0.769 0.805* 0.699
D1 1 0.7 0.727 0.687
D2 1 0.679 0.6
E1 1 0.792
E2 1
The boxes highlighted in gray color are the intraobserver scores
*Asterisk means the largest kappa value
32
Table 5. Summary of the2nd phase (modified lateral pillar classification using the refined criteria: intra- and interobserver reliability (κ value)
A1 A2 B1 B2 C1 C2 D1 D2 E1 E2
A1 1 0.9 0.656 0.706 0.807* 0.75 0.656 0.494 0.629 0.622 A2 1 0.602 0.62 0.739 0.68 0.59 0.492 0.592 0.557
B1 1 0.886 0.742 0.649 0.724 0.502 0.536 0.637
B2 1 0.773 0.589 0.767 0.55 0.694 0.737
C1 1 0.806 0.727 0.598 0.642 0.66
C2 1 0.692 0.514 0.536 0.589
D1 1 0.739 0.741 0.792
D2 1 0.727 0.743
E1 1 0.948
E2 1
The boxes highlighted in gray color are the intraobserver scores
*Asterisk means the largest kappa value
33
Table 6.Summary of the 3rd phase (grading of growth plate involvement): intra- and interobserver reliability (κ value)
A1 A2 B1 B2 C1 C2 D1 D2 E1 E2
A1 1 0.743 0.659 0.574 0.381 0.335 0.609 0.732 0.228 0.324 A2 1 0.679 0.592 0.531 0.483 0.502 0.595 0.099 0.311 B1 1 0.843 0.471 0.344 0.665 0.843* 0.294 0.414
B2 1 0.457 0.349 0.687 0.813 0.273 0.294
C1 1 0.913 0.592 0.363 0.092 0.241
C2 1 0.476 0.264 0.095 0.223
D1 1 0.671 0.183 0.343
D2 1 0.324 0.183
E1 1 0.316
E2 1
The boxes highlighted in gray color are the intraobserver scores
*Asterisk means the largest kappa value
34
Table 7. Summary of the3rd phase (grading of posterior pillar classification):
intra- and interobserver reliability (κ value)
A1 A2 B1 B2 C1 C2 D1 D2 E1 E2
A1 1 0.952 0.498 0.71 0.575 0.64 0.222 0.244 0.673 0.798*
A2 1 0.536 0.755 0.625 0.696 0.245 0.269 0.64 0.765
B1 1 0.629 0.542 0.52 0.277 0.291 0.551 0.422
B2 1 0.665 0.736 0.273 0.299 0.68 0.655
C1 1 0.69 0.25 0.274 0.492 0.61
C2 1 0.242 0.255 0.619 0.73
D1 1 0.786 0.194 0.246
D2 1 0.212 0.26
E1 1 0.757
E2 1
The boxes highlighted in gray color are the intraobserver scores
*Asterisk means the largest kappa value
35
Table 8. Summary of the 4th phase (modified lateral pillar classification using the refined criteria plus gradings of physeal involvement and posterior pillar involvement): intra- and interobserver reliability (κ value)
A1 A2 B1 B2 C1 C2 D1 D2 E1 E2
A1 1 0.953 0.488 0.45 0.583 0.516 0.426 0.471 0.712 0.727 A2 1 0.479 0.439 0.615 0.541 0.443 0.491 0.716 0.732
B1 1 0.953 0.708 0.751 0.6 0.462 0.666 0.628
B2 1 0.685 0.729 0.61 0.468 0.617 0.58
C1 1 0.817 0.757 0.565 0.764* 0.748
C2 1 0.67 0.491 0.739 0.725
D1 1 0.67 0.734 0.723
D2 1 0.725 0.677
E1 1 0.983
E2 1
The boxes highlighted in gray color are the intraobserver scores
*Asterisk means the largest kappa value
36
Table 9. Summary of intraobserver reliability (mean and SD of disagreement)
rater
Phases
phase 1 phase 2 phase 3(1) phase 3(2) phase 4 A 0.25(0.57) 0.25(0.57) 0.89(1.69) 0.08(0.5) 0.13(0.42) B 1.21(1.28) 0.25(0.67) 0.67(1.43) 1(1.6) 0.13(0.42) C 0.08(0.5) 0.38(0.75) 0.33(0.89) 0.5(1.34) 0.33(0.63) D 0.5(0.95) 0.42(0.77) 1.22(1.68) 0.25(0.84) 0.46(0.79) E 0.38(0.75) 0.13(0.42) 1.44(2.22) 0.58(1.2) 0.04(0.25) overall 0.48(0.93) 0.28(0.65) 0.91(1.67) 0.48(1.19) 0.22(0.55)
p-
value1) <0.001 - - - -
p-
value2) 0.035 0.552 <0.001 0.035 -
1) means possibility for significant difference among overall phases.
2) means comparison phase 4 with other phases, which is corrected with Hochberg method.
37
Table 10. Interobserver reliability (mean and SD of disagreement)
Phases
phase 1 phase 2 phase 3(1) phase 3(2) phase 4 Mean(SD) 0.55(0.61) 0.49(0.54) 1.32(1.28) 0.84(0.92) 0.51(0.57)
p-value1) <0.001 - - - -
p-value2) 0.728 0.728 <0.001 <0.001 -
1) means possibility for significant difference among overall phases.
2) means comparison phase 4 with other phases, which is corrected with Hochberg method.
38
Figure 1.Lateral pillar A according to the refined criteria. Lateral pillar height of the epiphysis is well-maintained. Outer sclerotic margin of the lateral pillar and subphyseal sclerotic line of the epiphysis are intact. There is little radiolucency inside the lateral pillar.
39
Figure 2. Lateral pillar B according to the refined criteria.(1) Lateral pillar height of the epiphysis is more than 50%. Outer sclerotic margin of the lateral pillar is intact.
There is some radiolucency inside the lateral pillar. (2) Subphyseal sclerotic line of the epiphysis is preserved.
40
Figure 3. Lateral pillarB/C border according to the refined criteria. (A) Lateral pillar height maintained but very narrow pillar (2~3mm): falciform-shaped viable lateral pillar (arrow). Outer sclerotic margin is distinct. Subphyseal sclerotic line is disrupted. (B) and (C) Lateral pillar height is at least 50%. There is very little ossification inside the lateral pillar (arrow). Outer sclerotic margin is indistinct. (D) Lateral pillar height is exactly 50% of original epiphyseal height. However, there is mixed sclerosis and radiolucency inside the epiphysis of the lateral pillar. There is no collapse of central part: lateral pillar is depressed relative to central pillar.
41
Figure 4. Lateral pillar C according to the refined criteria. Lateral pillar height is less than 50%, sometimes showing cocked hat deformity (arrow).
42
Figure 5. Grading of growth plate involvement of the proximal femur. The extent of involved growth plate was determined according to several factors, i.e. site of disruption, extent of irregularity, widening, proximal convexity, but seemingly not associated with metaphyseal cyst location.
43
Figure 6. Grading of posterior pillar involvement. The posterior pillar classification assesses 15% to 30% of the femoral epiphysis according to the same criteria as those of the original lateral pillar classification. In this radiograph, the height of the posterior column is between 50% and 100% of the original height.