• Tidak ada hasil yang ditemukan

거리계산법

Dalam dokumen 비영리 - S-Space - 서울대학교 (Halaman 31-35)

희귀질환-패스웨이, 약물-패스웨이 두 테이블의 유사도 확인을 위해 서 FDR값을 벡터로 사용한다. FDR값을 사용하는 이유는 p-value값 보 다 패스웨이가 좀 더 유의미하게 바라볼 수 있기 때문이다. 〔20〕

FDR이란 다중비교문제에서 1종 오류를 조절하는 방법으로, 특히 유 전학 연구에서 대량의 유전체 마커와 질병과의 연관성을 보는 연구에서 많이 사용되는 방법이다. 다중비교문제에서 기본적으로 많이 사용하는 본페로니 방법은 전체 테스트의 1종 오류를 alpha(예를들어 0.05)로 고정 하는 방법이다. 즉, 전체 테스트가 유의하지 않은 경우, 유의하다고 잘못 판단할 확률을 0.05로 한 것이다. 수식은 아래와 같다. 따라서 유의하다 고 판단한 것 중 틀릴 확률을 고정하는 새로운 p-value를 정의하는 방법 으로 사용된다.

FDR = false positive / total positive

(total positive = false positive + true positive)

즉, 유의하다고 판단된 값 중 실제로는 유의하지 않은 것의 비율이다.

이 비율을 0.05로 고정한다면, 유의하다고 판단했을 때 틀릴 확률은 0.05 로 고정할 수 있다. 실제 유의한(혹은 인과적 관계를 갖는) 마커를 알아 야 FDR을 정확히 구할 수 있는데 이것은 어려운 일이다. 따라서 다양한 방법으로 FDR을 추정하는데 대표적인 방법으로 “Benjamini-Hochberg procedure”가 있다. 모든 마커의 p-value를 내림차순 정렬을 한 후, 개별 테스트의 p-value를 다르게 적용하는 방법으로 p-value가 낮은 마커로 갈수록 점점 엄격한 p-value의 컷오프를 적용하였다.

따라서 p-value는 유의미한 값을 알기 위해 쓰지만, 통계적으로 유의 미한 결과는 찾았지만 실제로 그룹 평균에 차이가 없기에 다중 비교문제 에서는 사용하기 어렵다. 따라서 여러 번의 테스트로 인해 문제를 극복

하는 방법 중에 한 종류인 FDR 값을 사용한다. 본 연구에서도 다중 비 교문제인 여러 패스웨이들을 비교해서 보는 것이기 때문에, FDR 값을 활용하였다.

공통된 패스웨이가 기준이 되어 희귀질환과 약물이 계산될 수 있는 이유는 벡터화가 가능하기 때문이다. 벡터화를 하는 방식은 [그림9]와 [그림10]을 예시로 설명하였다. [그림9]은 D1과 R1에 대한 공통 패스웨 이 P1으로 거리계산을 한 결과이고 [그림10]은 D2와 R1에 대한 공통 패 스웨이 P1으로 거리계산 한 결과이다. 좌표값은 FDR값을 기준으로 한 다. 공통된 패스웨이를 중심축이 되어, 희귀질환과 약물이 각각 한 축을 담당하게 된다. 희귀질환-패스웨이, 약물-패스웨이로 나오는 FDR 값을 기준으로 점을 찍으면 두 개의 점이 생긴다. 이 두 개의 점 사이의 거리 를 구하면, 희귀질환과 약물의 거리를 측정할 수 있게 된다. D1과 D2의 비교를 통해서 거리계산을 통해 나온 값이 패스웨이 1개에 해당하는 거 리가 측정된 것이다. 희귀질환과 약물의 거리 측정을 공통된 1883개의 패스웨이로 연산하기 위해 유클리디안 거리계산법이 사용된다.

[그림9] 예시. P1 기준 D1과 R1에 대한 관계 그래프

[그림10] 예시. P1 기준 D2와 R1에 대한 관계 그래프

공통된 패스웨이가 기준이 되기 때문에 유사도 계산을 할 수 있다.

FDR 값들이 한 개의 점으로 존재하고, 각각의 파일에서 희귀질환–약물 의 유사도는 유클리디안 유사도를 통해 계산한다. 유클리디안 유사도란, 유클리디안 거리를 구해서 두 벡터의 유사도로 사용하는 것을 말하며 계 산법은 아래와 같다.

희귀질환–약물의 유사도를 통해서 유사도 값이 작을수록 서로 가까운 거리에 존재한다는 것을 알 수 있다. 이러한 방법을 통해서 희귀질환의 신약재창출 후보 가능성을 수치화하여 볼 수 있고, 희귀질환과 관련된 약물을 찾을 수 있다.

Dalam dokumen 비영리 - S-Space - 서울대학교 (Halaman 31-35)

Dokumen terkait