생물학적 경로를 기반으로 희귀질환 신약을 재창조하는 방법론을 연구합니다. 키워드: 희귀질환, 유전자, 약물재창출, 생물학적 경로, 약물추천, 신약개발.
서 론
연구의 필요성
생물학적 경로는 이러한 다대다 방법을 사용하기 위한 기초를 형성할 수 있습니다. 이는 프로세스의 역학을 자세히 설명하는 깊은 생물학적 지식을 표현합니다. [5] 생물학적 경로는 유전자를 켜거나 끄고 세포를 움직일 수 있습니다.
신약재창출
자연어 처리 접근법은 의학, 생물학 문헌을 통해 생물학적 개체 관계를 추출하기 위해 개발된 방법이다.[10] 대표적인 방법으로는 IBM이 개발한 왓슨(Watson)이 있다. 머신러닝 기반 접근방식은 선형회귀, SVM, 랜덤 포레스트, 신경망, 딥러닝 등의 방법을 말하며, 요즘 학습의 최신 기술로 널리 사용되고 있나요? 데이터 수집은 명확한 목적을 염두에 두고 수행되어야 합니다.
연구 목적
연구재료 및 방법
연구 재료
희귀질환 데이터베이스
Green 학위를 사용한 이유는 가장 밀접하게 관련된 유전자를 이용하면 보다 정확한 생물학적 경로를 얻을 수 있다고 생각되었기 때문이다. 희귀질환에 대한 데이터베이스는 여러 개 있지만, 패널에 희귀질환을 사용한 이유는 가장 관련성이 높은 유전자에 대한 정보만을 활용해 유전자 데이터의 신뢰도를 높이기 위해서였다. 희귀질환 유전자에 대해서는 환자 수가 적고, 알려지지 않은 정보가 많아 명확한 정보를 얻기 어렵다.
따라서 우리는 패널의 희귀질환 유전자를 가장 유용한 데이터로 간주했습니다. 본 연구에서는 패널에 포함된 308개의 희귀질환을 희귀질환 관련 유전자를 활용하였고, 301개의 희귀질환을 생물학적 경로와 연계하여 활용하였다. 활용이 불가능한 희귀질환 309개 중에는 아직까지 규명된 유전자가 없고, 생물학적 경로에서 찾아볼 수 없는 유전자가 있어 희귀질환명만 있었다.
약물 데이터베이스
의약품 데이터베이스 중 물에 대한 정보가 가장 많고 지속적으로 업데이트되므로 데이터의 신뢰성을 확보하기 위해 이 데이터베이스를 사용하였다.
생물학적 패스웨이 데이터베이스
이에 대한 계산과정이 제대로 이루어졌기 때문이다. 또한, API를 제공함으로써 분석정보를 빠르게 얻을 수 있습니다. 본 글에서는 Reactome에서 서비스로 제공하는 RestfulAPI를 이용하여 관련 유전자에 대한 생물학적 경로를 검색해 보았습니다.
조건은 FDR 값을 기준으로 사람을 기준으로 하였으며 상호작용은 False로 설정하였습니다.
방법
전처리과정
아래 [그림 6]은 PanelApp에서 Amyloidosis를 검색했을 때 나타나는 유전자의 형태와 전처리 과정을 거쳐 변환된 테이블 형식을 보여준다. 약물에 대한 유전정보는 Drugbank에서 다운로드하여 보실 수 있습니다. 따라서 신약의 재발명을 목적으로 한다면, 이미 승인된 의약품의 안전성이 보장되고, 의약품과 유전자의 관계가 명확히 밝혀졌기 때문에 본 논문의 연구에 활용하는 것이 적절하다고 판단하였다.
이러한 이유로 Drugbank에서는 약물-유전자 관계를 전처리하여 얻은 정보를 활용하였다. [그림 7]은 약물-유전자 관계가 전처리 과정에 따라 어떻게 그룹화되는지 보여줍니다. 그림 7] 약물과 유전자의 관계에 대한 전처리 과정.
희귀질환–약물의 공통 생물학적 패스웨이
거리계산법
희귀질환과 약물을 공통경로로 계산할 수 있는 이유는 벡터화가 가능하기 때문이다. 공통의 경로가 중심축이 되고, 희귀질환과 의약품이 각각 그 축을 담당하게 됩니다. 유클리드 거리 계산 방법은 공통 1883 경로를 사용하여 희귀질환과 약물 간의 거리를 계산하는 데 사용됩니다.
공통 경로를 기준으로 삼아 유사도를 계산할 수 있다. FDR 값은 단일점으로 존재하며, 각 파일 내 희귀질환과 약물 간의 유사도는 유클리드 유사도를 통해 계산됩니다. 희귀질환과 약물의 유사성을 통해 유사도 값이 작을수록 서로 더 가까운 것을 알 수 있다.
결론
희귀질환-약물 유사도
신약재창출 약물 후보
희귀질환명 패널 유사성 결과 순위 방광암 관련성. 희귀질환명 유전자의약품명 Uniprot_ID. 가족성 메니에르병 NFKB1 탈리도마이드 P19838 [표 6] 탈리도마이드 관련 희귀질환 순위.
표 7] 희귀질환 유전자-탈리도마이드(약물)에 대한 결과. "가족성 고콜레스테롤혈증 - 표적 패널"은 "APOB, APOE, LDLR, LDLRAP1 및 PCSK9" 패널을 기반으로 하는 희귀 질환과 관련된 유전자를 의미합니다. '폐동맥고혈압'이라는 희귀질환을 치료하는 데 사용된다.
표 9] 희귀질환별 보센탄 약물의 유사도 값. 표 10] 보르테조밉 약물의 희귀질환별 유사도 값.
고찰
Introduction: The aim of this study is to use biological pathway data for drug repositioning for rare diseases. In this study, a list of common biological pathways is generated from gene data related to drugs and rare diseases, to find new drug candidates for rare diseases. Based on the common route list and the similarities between rare diseases and drugs, a candidate list for rare diseases and drugs is generated.
Therefore, the more similar a rare disease and a drug are, the more likely it is to be a candidate for rare disease drug repositioning. Rare disease-drug pathway results were also compared to rare disease-gene-drug results with the drug, Thalidomide. Discussion: From the results, it can be confirmed that the list of drugs for rare diseases was relevant with the existing treatments of rare diseases.