“의료 인공지능(AI) 성패, 양질 데이터가 관건'
연세의대 윤덕용 교수 '편향된 자료 기반 AI 모델은 오히려 국민건강 불균형 초래'
2022.02.16 05:05 댓글쓰기
[데일리메디 구교윤 기자] “의료 인공지능(AI) 모델 성패는 양질의 데이터에 달려있습니다. 특히 편향된 데이터를 학습한 인공지능은 오히려 국민 건강 불균형을 초래할 위험이 있습니다.”
 
지난 15일 빅데이터임상활용연구회가 주최한 온라인 세미나 ‘빅데의(醫)터가 바라보는 10년 뒤 의료현장’에서 윤덕용 연세대학교 의과대학 의생명시스템정보학교실 교수가 이 같이 말했다.
 
윤 교수는 이날 의료 인공지능(AI) 모델 방향성을 최근 보건의료 분야 연구 트렌드로 자리잡은 빅데이터와 엮어 설명했다.
 
의료 AI 불확실성은 결국 데이터 문제

윤 교수는 "의료 AI 모델 성능은 양질의 데이터가 좌우한다"고 역설했다의료계 안팎으로 제기되고 있는 의료 AI 모델에 관한 불확실성이 데이터와 연관이 깊다는 주장이다.
 
그는 “현재 각광받고 있는 의료 AI 모델은 데이터에서 패턴학습을 하는 머신러닝의 일종이다”라며 “데이터에 의존할 수밖에 없기에 데이터 품질과 양에 따라 성능이 달라진다”고 말했다.
 
여기서 윤 교수는 AI 모델이 학습하는 데이터의 균형을 거듭 강조했다.
 
그는 “최근 많은 의료 AI 모델이 등장하면서 의료 현장에서 사용되고 있으나 학습한 데이터의 편향에 따른 우려도 커지고 있다”고 밝혔다.
 
이를테면 의료 AI 모델을 우리나라 국민에게 사용하기 위해서는 전국 모든 국민에게서 데이터를 수집해야 하는데 현실에서는 그렇지 않다는 얘기다.
 
실제 미국의 경우 의료 AI 모델을 개발하기 위해 의료 데이터를 16개 주에서 수집하고 있으나 대부분의 데이터가 캘리포니아, 메사추세츠, 뉴욕 등 3개 주에 편중돼 있다.
 
이럴 경우 꾸준히 제기되고 있는 의료 AI 모델의 ‘불확실성’도 해결되지 않는다는 게 윤 교수 설명이다.
 
윤 교수는 “모든 사람의 의료 데이터를 균일하게 수집하는 게 가장 바람직하나 현실을 그렇지 않다”면서 “특정 인구집단을 학습 데이터로 사용할 경우 해당 AI 모델은 다른 인구집단에서는 기존의 성능을 발휘하지 못할 수 있다”고 말했다.
 
특히 “의료 AI 모델이 특정 인구집단에 편향된 데이터만 학습할 경우 향후 인구집단 내 질병 유병률에도 성능을 미치게 되면서 의료 불평등도 야기할 수 있다”고 경고했다.
 
윤 교수는 이를 해결하기 위해 결국 양질의 데이터를 축적해가는 것이 중요하다고 말했다. 빅데이터라고 단순히 많은 양의 데이터를 모아야 한다는 생각을 지양해야 한다는 얘기다.
 
윤 교수는 또 앞으로 우리나라 국민을 대표하는 표준화된 데이터를 확보해나가야 한다는 방향성도 제시했다.
 
그는 “해외에서 좋은 AI 모델을 도입할 경우 적어도 우리나라를 국민을 대표하는 데이터를 적용해 사용할 수 있어야 한다”면서 표준화된 데이터 확보의 중요성을 거듭 강조했다.
 
끝으로 그는 “의료 AI 모델이 향후 의사를 대체하기보다 의사가 하지 않아도 되는 일을 대신하는 등 새로운 업무 프로세스를 만드는 중요한 역할을 해나가겠다”고 약속했다.


댓글 0
답변 글쓰기
0 / 2000
메디라이프 + More
e-談