제약바이오 생성형 AI와 할루시네이션(허위정보)
한세희 LG AI연구원 랩장 "적은 양의 데이터 등 신뢰 무너뜨릴 수 있다"
2023.11.16 11:07 댓글쓰기



한세희 LG AI연구원 랩장이 지난 2일 서울 이태원 몬드리안에서 개최된 ‘AI 파마코리아(Pharma korea) 컨퍼런스 2023’에서 강연을 진행하고 있다. 최진호 기자

"생성형 AI 언어모델은 합성신약 개발과정에 적용 및 활용될 때 인터넷상 가짜뉴스 문제보다 할루시네이션(허위 정보 생성)이 더욱 심각하다. 적은 양의 데이터 등으로 신뢰성 문제에 봉착해 있다."


한세희 LG AI연구원 랩 그룹장은 최근 한국제약바이오협회와 한국보건산업진흥원 주최로 개최된 ‘AI 파마코리아(Pharma korea) 컨퍼런스 2023’에서 이같이 말했다.


컨퍼런스는 ‘제약바이오산업 역할’, ‘AI 신약개발’ 등을 주제로 강연이 진행됐다. 박준석 대웅제약 센터장, 한태동 동아ST 상무 등 산업 전문가들이 참여해 제약산업과 AI 현안을 논의했다.


주요 발표에는 ▲‘AI 신약개발 프론티어’ 세션에서 한세희 LG AI연구원 랩장이 ‘생성형 언어모델을 활용한 신약개발’을 주제로, 신약 연구에 적용 가능한 생성형 AI의 현황과 시사점을 공유했다. 


한세희 LG AI연구원 랩장은 “LG화학 본부에선 AI 기술을 활용해 더 빠르게 잘 개발하고 싶은 니즈가 있었다”라며 “수년간 계열사들이 AI 연구를 통해 가능성을 볼 수 있었다”고 운을 뗐다.


그러면서 “최근 부상한 생성형 AI 모델을 활용해 범용적인 AI를 선보여야겠다는 생각을 했다”라며 “오픈AI 기술이 범용적인 용도가 될 수 있는 부분들이 있어, 각 산업에서 기대하고 있는 상황”이라고 설명했다.


실제 국내에선 네이버 등 굴지 IT기업들이 대화형 엔진 서비스를 출시했고, 대학가에선 학생들이 과제 해결을 위해 생성형 AI 검색 서비스를 활용하는 등 다양한 분야에서 이용되고 있다.

한세희 LG AI연구원 랩장이 ‘AI 파마코리아(Pharma korea) 컨퍼런스 2023’에서 강연을 진행하고 있다. 최진호 기자

바이오·화학 등 전문분야에서 가짜뉴스 '매우 심각' 


다만, 제약바이오 산업계에서는 아직 생성형 AI 기술이 초기 단계이다 보니 적은 양의 데이터, 데이터에 대한 신뢰성, 국내 인공지능(AI) 개발 속도 등에 대한 문제점과 한계점이 나온다.


한세희 랩장은 “연구 3년이 지났지만 내년에도 과거 1개 과제에 투입했던 것과 동일한 정도의 리소스, 시간, 노력이 필요하다”면서 “빠르게 확산하는 그림을 그리기 어렵다”고 아쉬움을 드러냈다.


이어 “여전히 우리는 적은 양의 데이터를 가지고 싸워야 하는 문제에 봉착해 있다”며 “인터넷 상에서 가짜뉴스가 너무 심각한데 바이오, 화학 등 전문분야는 더욱 심하다”고 강조했다.


실제로 챗GPT를 활용해 '화학반응' 관련 질문을 던졌을 때, 특별한 화학반응이 아님에도 사실과 다른 논문을 가져다 붙이는 등 데이터 오류 문제가 해결되지 않고 있는 상황이다.


한 그룹장은 “내용의 사실 여부는 생성형 AI에게 그다지 중요하지 않다”며 “빠른 서치로 니즈(Needs)는 많지만 보안상 공개되지 않은 정보까지 가져올 수 없는 등 데이터가 부족하다”고 설명했다.


다만 생성형 AI 기술이 신약개발에 있어 더욱 가능성을 높여준다는 점 등은 오히려 혁신이 될 수 있다고 봤다. 특히 오랜시간이 걸려 불가능하다고 봤던 연구도 가능하게 해주는 점을 강조했다.


한 랩장은 “많은 문서를 익히면서 문서 내 지식데이터 정보 및 구조와 어떤 물성 간의 관계들을 습득하고 그 안에서 가설을 만들어 낼 수 있다”며 “가설 실패와 성공을 반복하는 평가를 거치게 할 수 있다”고 말했다.


그러면서 “현재는 현상 분류, 인식 수준이지만 단기적으로 '사실 기반 원인 및 근거 제시' 단계까지 갈 수 있을 것”이라며 “중장기적으로는 미래 예측 기반 통찰 제시, AI 기반 자율 실행까지 진화가 예상된다”고 전망했다.



댓글 0
답변 글쓰기
0 / 2000
메디라이프 + More
e-談