서울아산, 빅데이터 활용 신약 효과 찾는 알고리즘 개발
김영학·오지선 교수팀, 91만명 기반 데이터 입력하면 '후보약물' 제시 가능
2020.11.26 16:07 댓글쓰기

[데일리메디 박정연 기자] 빅데이터를 활용해 신약에 우연히 숨겨진 효과를 찾을 수 있는 알고리즘이 개발됐다.

서울아산병원 정보의학과 김영학·오지선 교수, 김도훈 임상강사 연구팀은 91만여 명의 임상 빅데이터를 기반으로 기존에 쓰이고 있는 약제의 새로운 용도를 발견해 내는 신약 재창출 알고리즘을 개발했다고 26일 밝혔다.

특정 질환을 진단하거나 치료 경과 평가에 사용되는 검사 내역과 처방력 데이터를 알고리즘에 입력하면, 해당 질환 치료에 영향을 주는 약물 후보군을 선별하고 추정되는 약효 크기에 따라 우선 순위를 책정해준다.


이때 알고리즘이 선별해낸 후보 약물군에는 이미 해당 질환에 효능을 인정받은 약물들이 대부분 포함된다. 그렇지 않은 약물이 포함된다면 이 약물이 바로 신약 재창출 후보군이 되는 것이다.


예를 들어, 당뇨병의 진단에 활용되는 대표적인 지표인 당화혈색소를 알고리즘에 입력하면 당화혈색소 수치를 증가, 감소시키는 효과가 있는 약물군을 추정되는 효과에 따라 순서대로 나열해준다.

이때 당뇨가 아닌 다른 질환 치료제로만 사용되던 약물이 당화혈색소 수치를 감소시키는 효과도 있다고 분류되면, 당뇨병 신약 후보가 되는 원리다.


당뇨·이상지질혈증 예측도 최대 100%

서울아산병원 정보의학과 연구팀은 혈액검사를 받은 환자 91만여 명의 약물 처방 내역과 약 복용에 따른 혈액 검사 변화를 한 번에 분석할 수 있도록 데이터를 알고리즘에 학습시켰다.


모든 데이터는 환자 개인정보보호를 위해 서울아산병원 임상연구심의위원회(IRB)의 승인을 받아 비식별 절차를 거친 후 활용됐다.


그중 임상 데이터가 많고 수치로 쉽게 약효를 파악할 수 있는 질병인 당뇨와 이상지질혈증을 우선적으로 선택해, 각 질병의 임상 지표인 당화혈색소와 LDL 콜레스테롤, 중성지방을 알고리즘에 입력해 결과를 도출했다.

그 결과 환자들에게 처방된 총 1774개 약물 중에서 당화혈색소와 LDL 콜레스테롤, 중성지방 수치를 감소시키는 약물이 각 41개, 146개, 65개로 나타났다.


연구팀은 알고리즘이 찾아낸 약물들이 실제 효과가 있는지 확인하기 위해 세계보건기구가 정한 의약품 분류체계(ATC, Anatomical Therapeutic Chemical classification)를 활용해 음성 예측도와 민감도 등을 분석했다.
 

음성 예측도는 효과가 없다고 예측 분류한 약물이 실제로 해당 용도를 가지고 있지 않은 비율이고, 민감도는 알고리즘이 어떤 질환에 실제 효능이 있는 약물에 대해 치료 효과가 있다고 올바르게 분류하는 비율이다.

각 수치가 높을수록 알고리즘 성능이 좋다고 판단했다.


그 결과 LDL 콜레스테롤 약물의 경우 음성 예측도와 민감도가 각각 100%였다. 당화혈색소, 중성지방 약물의 경우 각각 음성 예측도가 95%, 98%, 민감도가 94%, 89%였다.

또한 알고리즘에 여러 질환에 대한 임상 지표를 입력하면 우선 순위를 갖는 약물도 파악 가능해, 환자의 개인 건강 상태에 맞춘 최적의 약물 선별도 가능할 것으로 기대된다.


서울아산병원 정보의학과 오지선 교수는 “이번 시도는 신약 개발을 위한 비용과 시간을 최소화하면서 더 많은 치료제를 필요로 하는 의료현장의 미충족 수요를 해결하는데 기여할 수 있을 것”이라고 말했다.


서울아산병원 헬스이노베이션빅데이터센터 김영학 교수는 “후보물질 선정부터 임상시험 단계 등 오랜 시간이 소요되던 초기 단계를 단축할 수 있다는 것만으로도 큰 도움이 된다”고 기대감을 표했다.


한편, 서울아산병원 아산생명과학연구원과 한국보건산업진흥원, 산업통상자원부 공동 후원으로 진행된 이번 연구는 임상약리학분야의 국제 학술지인 ‘임상약학 및 치료학회(IF=6.565)’ 최신호에 게재됐다.



댓글 0
답변 글쓰기
0 / 2000