빅데이터와 AI로 코로나 해외 유입 확진자수 예측..KAIST 이재길 교수 연구팀 개발

김지성 기자 승인 2020.08.24 17:55 | 최종 수정 2020.08.25 11:27 의견 0
인공지능 기반 코로나19 해외 유입 확진자 예측 과정. (자료=한국과학기술원)

[디지털머니=김지성 기자] 코로나 시대 국내 연구진이 빅데이터와 인공지능(AI)으로 해외 유입 확진자 수를 예측할 수 있는 모델을 개발해 주목을 끈다.

K방역은 핵심은 단순히 의학 분야 기술의 문제가 아니다. 얼마나 IT 인프라를 효과적으로 활용해 발 빠르게 대응하느냐가 핵심 가치다. 연장선상에서 선제적으로 해외 유입 확진자 수를 예측하게 될 경우 더욱 효과적인 K방역 시스템을 구축할 수 있을 것으로 기대된다.

■ 다양한 데이터 활용 연구 결과 세계 학술 대회에서 발표

한국과학기술원(KAIST) 산업및시스템공학과 이재길 교수 연구팀이 23일 코로나19 해외유입 확진자 수를 예측하는 빅데이터‧인공지능(AI) 기술을 개발했다고 밝혔다.

해당 연구팀은 ▲해외 각국의 확진자 수와 사망자 수 ▲해외 각국에서의 코로나19 관련 키워드 검색 빈도 ▲한국으로의 일일 항공편 수 ▲해외 각국에서 한국으로의 로밍 고객 입국자 수 등의 데이터를 데이터화하고 이를 인공지능(AI) 기술과 접목해 향후 2주간의 해외유입 확진자 수를 예측하는 기술을 개발했다.

관련 연구 결과는 최고권위 국제 학술대회 'ACM KDD 2020'의 'AI for COVID-19' 세션에서 오는 24일 발표된다. (논문명 : Hi-COVIDNet: Deep Learning Approach to Predict Inbound COVID-19 Patients and Case Study in South Korea)

논문은 한국과학기술원 지식서비스공학대학원에 재학 중인 김민석 박사과정이 제1 저자로 강준혁, 김도영, 송환준, 민향숙, 남영은, 박동민 등이 제2~제7 저자로 각각 참여했다.

산업및시스템공학과 이재길(앞줄 오른쪽 두번째) 교수와 연구팀.(자료=한국과학기술원)

■ 빅데이터와 AI 적극 활용 ‘하이 코비드넷’ 완성

연구진은 기본적으로 해외 각국의 코로나19 위험도를 산출을 위해 보고된 확진자 수와 사망자 수를 활용했다. 하지만 이 수치는 진단검사 수에 좌우돼 현실을 정확하게 반영하지 못한다. 이에 코로나19 관련 키워드 검색 빈도를 입력 데이터로 활용해 해당 국가의 코로나19 위험도를 실시간으로 산출했다.

문제는 실시간 입국자 수는 기밀정보로서 외부에 공개되지 않는다. 이 때문에 매일 제공되는 한국에 도착하는 항공편수와 로밍 고객 입국자 수를 통해 입국자수를 유추한다. 로밍 고객 입국자 수 데이터는 KT로부터 제공 받았다. KT 고객 입국자만을 포함한다는 한계를 일일 항공편수를 함께 고려해 데이터의 오차를 줄였다.

해외유입 확진자 수 예측을 위해 국가 간의 지리적 연관성도 반영했다. 특정 국가의 코로나19 발병이 이웃 국가로 더 쉽게 전파되며, 국가 간 교류도 거리에 따라 영향을 받기 때문. 연구팀은 이러한 문제해결을 위해 지리적 연관성을 학습하도록 국가-대륙으로 구성된 지리적 계층구조에 따라 각 대륙으로부터의 해외유입 확진자 수를 정확히 예측하도록 인공지능(AI) 모델을 설계했다. 연구팀은 해당 인공지능 모델을 'Hi-COVIDNet(하이 코비드넷)'이라고 이름 붙였다.

연구팀은 약 한 달 반에 걸친 훈련 데이터로 만들어진 하이 코비드넷으로 향후 2주 동안의 해외유입 확진자 수를 예측했다. 이 결과 해당 모델이 기존의 시계열 데이터 기반의 예측 기계학습이나 딥러닝 기반의 모델과 비교했을 때 최대 35% 더 높은 정확성을 지니고 있음을 확인했다.

제1 저자로 참여한 김민석 박사과정은 “이번 연구는 최신 AI 기술을 코로나19 방역에 적용할 수 있음을 보여준 사례” 라면서 “K-방역의 위상을 높이는데 기여할 것으로 기대한다”고 밝혔다.

<저작권자> 디지털 세상을 읽는 미디어 ⓒ디지털머니 | 재배포할 때에는 출처를 표기해 주세요.