조기발병 대장암 환자 사망 위험을 예측할 수 있는 양자 머신러닝 모델이 개발됐다.
연세대학교 의과대학 의생명시스템정보학교실 박유랑 교수와 유재용 박사, 심우섭 연구원과 연세암병원 종양내과 김한상 교수 연구팀은 조기 발병 대장암 환자 임상데이터를 기반으로 사망 위험을 예측하는 양자 머신러닝 모델을 개발했다. 예측 정확도는 90%에 달한다.
젊은 대장암이라고도 불리는 ‘조기 발병 대장암’은 50세 미만에서 발생하는 대장암을 말한다. 우리나라 20~40대 대장암 발병률은 인구 10만명당 12.9로 세계 1위다.
조기 발병 대장암은 다른 연령층에서 진단되는 대장암과 비교해 더 공격적이고 생존율이 낮다. 때문에 조기에 질병을 발견하고 정확한 예후예측을 통한 치료가 중요하다.
최근 헬스케어 분야에서 질병 진단, 예후예측 등에 활용할 수 있는 AI 기반 다양한 인공지능 모델들이 개발되고 있다. 인공지능 모델 예측 정확도를 높이기 위해서는 충분한 임상데이터가 필수적이다.
하지만 헬스케어 분야는 비용 문제, 희귀질환에 대한 데이터 부족 등 어려움이 있다. 이로 인해 적은 데이터 양으로도 분석 정확도를 높일 수 있는 양자컴퓨팅 기술이 주목받고 있다.
연구팀은 양자컴퓨팅 기반 ‘Quantum Support vector machine’을 통해 조기 발병 대장암 환자 사망 위험 예측 모델을 개발하고 그 정확성을 분석했다.
2008년부터 2020년까지 세브란스병원에 내원한 조기 발병 대장암 환자 1253명 치료 데이터를 기반으로 질병 상태에 따른 사망 위험을 예측하는 양자 머신러닝모델을 개발했다.
양자컴퓨팅 기술을 활용한 머신러닝 모델 예측 인자로는 나이, 성별과 같은 환자 정보 데이터와 병기, 치료 정보에 관한 임상데이터 등 총 93개 변수를 적용했다.
연구팀은 해당 모델 효과성을 확인하기 위해 최적의 변수 개수 및 표본 크기, 결과변수 비율에 따른 정확도를 기존 머신러닝모델과 비교분석했다.
분석 결과, 기존 머신러닝 모델(Conventional SVM) 예측 정확도는 70%를 기록한데 비해 양자 머신러닝 모델은 조기 발병 대장암 환자 사망 위험 예측 정확도가 90%를 기록했다.
또한 연구팀은 양자컴퓨팅 견고성을 검증하기 위해, 사망과 생존 비율을 조절해 성능 검증을 진행했다. 그 결과, 기존 머신러닝 모델은 사망 비율을 불균형하게 조정했을 때 예측 성능이 80%를 보였다.
반면 양자 머신러닝 모델 예측 정확도는 사망 비율이 불균형한 상황에서도 88% 높은 예측 정확도를 유지하며, 양자 머신러닝 모델이 사망과 생존 비율이 불균형한 상황에서도 기존 머신러닝 모델에 비해 더 높은 예측 정확도를 유지하는 것을 확인했다.
박유랑 교수는 “이번 연구를 통해 조기 발병 대장암 환자 사망 위험을 정확히 예측하는 양자 머신러닝 모델을 구축했다”면서 “이를 기반으로 앞으로도 양자 머신런닝 모델을 활용해 다양한 영역 헬스케어 분야에 확장이 가능할 것으로 기대한다”고 말했다.
김한상 교수는 “이번 연구는 종양 분야에서 양자 컴퓨터, 의료 인공지능(AI) 등을 활용한 디지털 헬스케어가 접목되는 한 예로 암 진단, 치료, 생존자 관리에 디지털 헬스케어 기술 도입이 앞으로 암 진료 현장 치료 패러다임을 바꿀 수 있을 것”이라고 전했다.
한편, 이번 연구 결과는 국제학술지 ‘어플라이드 소프트 컴퓨팅’(Applied Soft Computing, IF 8.7)에 게재됐다.