한국인에 특화된 ‘제2형 당뇨’ 발병 예측을 위한 기계학습 모델이 개발됐다.
울산과학기술원(UNIST)는 이정혜 산업공학과 교수팀과 고신대학교복음병원 가정의학과 강지훈 교수팀이 대규모 한국인 코호트를 바탕으로 제2형 당뇨 발병 예측 성능을 높인 기계학습 모델을 개발했다고 밝혔다.
이들은 한국인에 특화된 다유전자 위험 점수(Genome-wide Polygenic Risk Score, gPRS)를 개발하고, 여기에 인구통계학적 정보와 임상 및 대사체 정보를 함께 활용했다.
기존의 당뇨 발병 위험예측 모델 연구는 주로 서양인 집단을 대상으로 했다. 동양인을 대상으로 해도 키와 몸무게, 가족력 같은 인구통계학적 정보나 당화혈색소(HbA1c) 수치, 콜레스테롤 수치와 같은 임상 정보를 이용했다.
이렇다 보니 한국인에 특화된 유전적‧환경적 요인까지 반영한 당뇨 예측에는 한계가 있었다.
이에 연구진은 한국인에 특화된 정보를 활용한 예측 모델 개발에 도전했다. 질병관리본부 국립보건원에서 수집한 한국인유전체역학조사사업(KoGES)의 대규모 코호트를 바탕으로 삼은 것이다.
이 코호트는 한국인에게 흔히 발생하는 당뇨, 고혈압, 비만, 대사증후군 등 만성질환 연구를 위해 지난 2001년부터 추적, 수집된 자료다.
연구진은 인구통계학적인 정보, 임상 정보에 유전 정보와 환경 정보를 더해 종합하면서 당뇨 발병 예측 가능성을 높였다.
최종 개발된 제2형 당뇨 발병 예측 모델은 인구통계학적 정보만 활용한 경우보다 약 11%p 예측 성능이 높았다. 인구통계학적 정보와 임상 정보까지 활용한 경우에는 약 4%p 향상된 예측 결과를 보였다.
이 모델을 임상 현장에서 활용한다면 제2형 당뇨를 효과적으로 예방하고 대응할 수 있다는 게 연구진의 전망이다.
이정혜 교수는 “서양인 코호트 중심으로 진행되던 연구를 한국인 코호트로 바꾸어 접근한 것에 큰 의미가 있다”며 “아시아 집단의 코호트 데이터를 이용하는 다양한 후속 연구에도 활용될 수 있을 것”이라고 기대감을 표했다.
한편, 이번 연구 결과는 의학 분야 최고 학술지인 란셋(The Lancet) 자매지인 ‘이바이오메디슨(eBioMedicine)’에 게재됐다.