세계화와 교통발달, 기후변화와 같은 환경 변화 속에서 인류를 위협하는 감염병 재난은 발생 주기가 빨라지고 있고 인류 건강과 사회 안전을 위협하는 큰 요소가 되어가고 있다. 특히 최근 코로나 바이러스(COVID-19) 재난을 통해 알 수 있었던 것과 같이, 재난의 급속한 확산 속에서 보다 빠르게 사전 위험을 탐지 예방하고, 감염병 발생 시에는 신속 분류 진단하고 모니터링하며 조치할 수 있도록 하는 감염병 대응 체계와 이를 지원할 수 있는 ICT 기술에 대한 필요성은 급격하게 높아졌다.
규칙 정형화가 어려운 분야에서 딥러닝과 인공지능 기술을 적용하면 빠른 대응을 해볼 수 있다는 큰 장점을 갖는다. 이러한 이유로 감염병 추세 파악, 전파확산 예측, 신속 진단 도구의 개발 등에 인공지능을 적용하기 위한 많은 시도들이 있었다. 그러나 동시에 신뢰성 있는 데이터의 확보와 신뢰도를 보장할 수 있는 응용 개발, 프라이버시에 대한 보호 이슈 등과 같은 많은 이슈들도 부상시켰다.
이에 본 보고서에서는 인공지능 기술을 활용하는 감염병 재난 대응 사례과 관련 기술 표준의 연구개발 동향들을 살피고, 국가 감염병 방역체계에 인공지능 기술을 적극 활용하기 위해 필요한 요소들을 살피고자 한다.
감염병 재난, COVID-19, 코로나 바이러스, SARS-CoV-2, 전염병, 인공지능, 표준화, 자동진단지원시스템, 음성인식,
DOI:10.22648/ETRI.2020.B.000005
(연구 시작 단계) 인공지능을 활용한 감염병 재난 대응 기술 연구는 이제 시작 단계로, 많은 연구들이 시작되고 있고 앞으로도 다양한 국제 협력과 연구개발이 진행되면서 성과 발표와 분석이 이어질 전망.
(AI 기반 감염병 대응 체계의 필요성) 감염병 재난은 인류가 직면한 큰 도전 중 하나라고 인식하게 되었다. 이를 극복하기 위한 방법으로 AI 기술 활용 사례들이 급증하고 있기에 지속적인 관심과 대응이 필요함
(AI는 훌륭한 방역 지원 도구) 감염병과의 싸움에서 감염병 발생의 조기 예측부터 진단기술 개발, 접촉자 추적, 신약 개발까지 감염병 대응의 전 과정에서 인공지능이 중요한 역할을 하게 될 가능성을 확인하였다. 포스트 코로나 이후에도 국가방역체계 고도화와 국민 안전 향상에 대한 AI 기술의 기여도는 계속 높아질 전망
(AI 기술과 응용은 확장중) ML/DL, 자연어처리, 음성인식과 같은 AI 기술들은 빠르게 융합되고 발전하고 있고, 재난 방역 단계별로 필요한 새로운 AI 응용들이 개발되고 있음. 제품화 수준이 높고 시장성이 큰 분야(자동진단 지원, 원격환자 모니터링과 예후 예측, 자동응답, 접촉자 추적, 신약 연구 등)에서 지속적인 투자와 연구개발이 진행될 것임
(제약과 한계) 많은 가능성도 있지만, 의료 데이터 활용에 대한 규제도 있고 AI 예측 결과를 아직 완벽하게 신뢰할 수 없거나 의료 현장에서 안심하고 사용할 수 없다는 한계점도 있음. 아직 실제 완성도를 달성한 사례도 소수이고, 다양하게 상호 교차 검증하는 결과들이 발표되지는 않았음. 그러므로 반드시 이런 제약과 한계를 인식한 다음 시작하는 것이 필요함
(프라이버시와 윤리) 데이터를 활용하여 원하는 성과를 달성하기 위해서는 무엇보다도 AI 응용을 위한 고품질 데이터 확보가 중요하다. 그러나 이 과정에서 반드시 프라이버시 보호 및 윤리적 문제 등도 함께 고려되고 해결되어야 함.
(다학제 협력) 감염병 재난 대응을 위한 AI 기술 분야는 의료 전문가, 감염병 전문가, 인공지능 전문가, 바이오 전문가들이 참여하는 다학제 협력 연구가 필수적이다. 그러므로 다학제 연구 개발 활동을 지원하고 장려해야 한다.
(개방형 혁신) 감염병 재난은 한 국가의 문제가 아니라 인류가 함께 해결해야 하는 문제이기에, 신종 감염병 위협에 빠르게 공동 대응하기 위해서는 개방과 공유에 기반한 국제 협력이 가능해야 함. 오픈데이터와 오픈소스, 그리고 오픈사이언스의 중요성이 부각되고 있으며, 개방형 협력과 혁신 노력은 AI 기술 발전과 관련 산업 발전을 더욱 가속화시킬 것임
(국가간 차이 극복) 국경을 초월한 국제 협력을 위해서는 데이터 신뢰도, 표준, 호환성, 품질 및 해석 기준, 국가별 규제 차이 등과 같은 많은 문제점의 공동 해결 노력이 필요
(신속 대응 협력 체계) 신속하게 양질의 데이터가 공개 되고 활용될 수 있는 체계와 익명화된 임상 데이터를 공유할 수 있는 개방형 글로벌 저장소가 필요하며, 데이터를 안전하게 교환할 수 있는 표준화된 체계와 정보보호 체계가 만들어져야 함
(표준화 체계 구축) 신종 감염병 대응을 위해 의료 AI 응용들이 유기적으로 연계되고 상호호환성을 가질 수 있도록 표준화 체계 구축이 시급히 필요하며, 국내 AI기술과 ICT를 기반으로 하는 K-ICT방역 국제표준화 활동을 적극적으로 지원하는 것이 필요함
세계화와 교통발달, 기후변화와 같은 환경 변화 속에서 인류를 위협하는 감염병 재난은 발생 주기가 빨라지고 있고 인류 건강과 사회 안전을 위협하는 큰 요소가 되어가고 있다. 특히 최근 코로나 바이러스(COVID-19) 재난을 통해 알 수 있었던 것과 같이, 보다 빠르게 사전 위험을 탐지 예방하고, 감염병 발생 시에는 신속 분류 진단하고 모니터링하며 조치할 수 있도록 하는 감염병 대응 체계와 이를 위한 ICT 기술 및 표준화의 필요성이 높아지고 있다.
감염병은 인류를 위협해 온 중요한 재난 중 하나다. 인류는 과학기술을 발전시키며 항생제, 백신 등을 개발하여 감염병 재난을 극복하기 위해 노력해왔지만, 늘 또다른 새로운 감염병이 등장하며 인류를 위협하고 있다 [[1]][[2]][[3]][[4]].
14세기 중엽 유럽에서 대유행했던 페스트의 파괴력은 대단했다. ‘페스트’는 1351년까지 유럽 전체 인구의 30~40%를 몰살시키면서 중세 유럽을 초토화시켰다. 16세기 약 천명의 스페인 원정대가 200만명 이상의 멕시코의 아즈텍 제국을 무너뜨리는 데는 ‘천연두’가 결정적인 역할을 하였고, 남미 안데스 고원의 잉카제국도 천연두 바이러스의 확산으로 몰락했다고 알려져 있다.
우리나라 역사에서도 감염병의 기록은 고대로부터 지속적으로 등장한다. [삼국사기]에는 고구려에서 3회, 백제 6회, 신라 18회의 전염병 발생을 기록하고 있다. [조선왕조실록]에는 1392년부터 1891년까지 500년 동안 1,000건 이상의 역병에 대한 기록이 있으며, 햇수로는 무려 160년이나 된다. 평균적으로 10년에 3번 이상 전염병이 유행한 셈이다.
전세계적인 교류와 이동이 많아진 20세기 들어와서는 그 파괴력이 더욱 커졌다. 1918년 3월 유럽과 미국에서 발생한 스페인독감(1918-1919, H1N1)은 전 세계적으로 4천만~1억 명의 사망자를 만들었으며, 1957~1958년 아시아 독감은 중국에서 시작되어 전 세계적으로 1,400만 명의 사망자를 발생시켰다. 10년 뒤에는 홍콩 독감(H3N2)이 전 세계적으로 140만 명의 사망자를 만들었고, 최근 전인류를 공포에 떨게하고 있는 코로나 바이러스 (COVID-19 )는 불과 3개월만에 300만명의 환자와 20만명의 사망자를 만들었다.
감염병에 대한 국가적 대응의 필요성을 인지하고 대응을 시작한 것은 1990년대 미국이었다. 1992년, 미국의학한림원(IOM)이 발간한 「Emerging Infections: Microbial Threats to Health in the United States」 보고서에서는 신종감염병 및 과거 감염병의 재출현 원인에 대해 분석 결과를 토대로 감염병 감시체계 확보, 감염병 연구 체계화, 백신·치료제개발 역량 확보, 보건인력교육 네 개 영역에 대한 개선안을 제시했다. 이를 계기로 미국에서는 1996년 6월 12일 신종 감염병의 감시·예방·대응을 위한 국가적 정책 수립을 시작했다 [[1]].
국제적인 차원에서는 세계보건기구의 2005년 국제보건규약(International Health Regulation, IHR ) 개정이 감염병의 감시 범위 확대와 더불어 국제적 협력을 시작하는 중요한 계기가 되었다. 1969년에 제정된 IHR에서는 3개 감염병(페스트, 콜레라, 황열)에 대한 집중적 감시만 하였으나, 2005년 개정을 통해 공중보건에 위협이 되는 모든 질병들을 대상으로 감시 적용 질병 범위를 확대하였고, 이를 WHO에 보고할 것을 의무화했다 [[1]]. 더불어 IHR의 주요 핵심 능력을 강화하고 진전시키고자 예방, 조기감지, 대응 분야로 구분된 국가별 위기대응에 대한 세부 측정지표(Joint External Evaluation, JEE)를 개발하여 국가별 대응 수준들을 평가하고 있다 [[3]].
우리나라도 2003년 상반기에 전 세계적으로 확산된 사스를 계기로 국가 차원의 감염병 대응을 시작하였다. 감염병 대응은 국가 핵심과제로 설정되어야 하고 감염병 관리를 위한 전문 운영체계 구축이 반드시 필요하다는 범정부적 인식하에서 검역법 개정(안)이 2003년 12월 29 일 국회 본회의를 통과하였고, 이에 따라 질병관리본부가 2004년 1월 17일자로 출범하였다.
이후 2003년 12월부터 시작되어 지속적으로 발생해온 고병원성 조류인플루엔자, 2009년 신종 인플루엔자를 겪으면서, 2010년 12월 30일자로 「전염병예방법」과 「기생충질환예방법」을 통합한 「감염병 예방 및 관리에 관한 법률」를 제정하고 법정 감염병의 분류체계와 대응체계를 개선하면서 국가차원의 대응체계를 체계화하기 시작하였다. 종합적이고 체계적인 감염병 예방 및 관리 계획 수립을 위해 5년 단위의 기본 계획도 준비하기 시작하였고, 2013년 8월에 제1차 “감염병의 예방 및 관리에 관한 기본계획 (2013~2017)”을 수립하여 공표하였다 [[3]].
2015년 중동호흡기증후군(M iddle East respiratory syndrome, MERS; 메르스)는 우리나라 국가 방역체계의 한계점과 문제점을 드러나게 하였고, 이를 계기로 국가 방역체계 개편방안을 마련하여 감염병 위기대비 및 대응체계를 강화하기 위한 노력들을 지속해오고 있다 [[2]].
메르스 사태 이후, 정부는 ’16년 4월 범부처 감염병 연구개발추진위원회를 구성하고 제1차 국가감염병 위기대응기술개발추진전략(’12~’16) 수립 시행하였고, 이어 2차 추진전략(’17~’21)을 수립 시행하였다. 2차 추진전략 수립 시행 후, 감염병 분야 과학·기술적 성과는 국가 R&D 평균보다 우위에 있으나 방역현장에서의 실용화 성과가 부족하고 방역활동의 전주기적 대응에는 한계가 있다는 문제가 도출되었다. 중점기술 중에서도 현재 미수행되고 있는 영역이 다수 도출이 되어, 범부처 차원에서 감염병 유입차단과 현장대응에 초점을 둔 감염병 연구개발을 새롭게 기획 추진하게 되었다 [[5]].
7개 부처 합동 방역연계 범부처 감염병연구개발사업(Goverment-wide R&D Fund for Infectious Disease Research, GFID )(’18-’22)에서는 총 연구기간 5년을 목표로 감염병 유입차단, 현장대응, 확산방지에 활용될 수 있는 7대 중점분야 30개 과제를 도출하여 관련 연구를 진행하고 있다. 이 중에서도 특히 확산방지(소통) 분야에서는 ICT 기술을 활용한 1) 빅데이터 기반 감염병 위험도 평가도구 개발, 2) 의료기관과 보건소 등 현장과 정보교환 시스템구축, 3) 자가격리자 관리를 위한 어플리케이션 및 대체기기 개발, 4) 감염병 전파규모 및 확산예측 시스템 구축 등의 4가지 영역 연구개발을 진행하고 있다 [[5]].
특히 최근 신종 코로나 바이러스 팬더믹 환경 속에서 사전 예측 및 자동 경보, 초기 대응시 의료진 과부하 문제, 자동 판독 및 진단 보조 필요성, 비대면 확산 방지 기술의 필요성, 인포데믹 문제 해결 필요성 등이 나타나면서 국내외적으로 D.N.A(Data, Network, AI) ICT 기술을 활용한 새로운 감염병 대응 기술 R&D 시도들도 많아지고 있다는 점에 주목할 필요가 있다 [[6]][[7]][[8]][[9]][[10]][[11]][[12]][[13]].
D.N.A 기술을 활용한 감염병 대응 체계는 새로운 감염병 유행 예측을 보다 빨리 가능하게 할 수 있으며, 가짜 정보에 대한 발견과 신속한 정정 대응이 가능하도록 해서 인포데믹을 방지하며, 의료 영상 자동 진단과 진단 속도 개선을 가능케 하여 보다 신속한 감염병 진단과 처방이 가능토록 하며, AI 기반 신약 개발은 신약 후보 물질 발굴과 기존 약물의 적용 가능성을 최단시간내에 발견 가능하게 하며, 오픈 데이터들은 대량의 기초 데이터와 정보들을 보다 신속하게 공유/활용할 수 있는 기반을 제공한다. 이처럼 국가 감염병 방역체계 수립에 있어 D.N.A 기술을 적극 활용하는 것은 방역체계 고도화에 크게 기여할 것으로 기대된다 [[6]][[7]][[8]][[9]][[10]][[11]][[12]][[13]][[14]][[15]][[16]][[17]].
인공지능(Artificial Intelligence, AI) 기술은 최근 기계학습(machine learning)과 딥러닝(deep learning) 방법론의 고도화에 힘입어 컴퓨터비전 등의 과제에서 급격한 발전을 이루어왔으며, 의료 분야에서도 지난 수년간 흉부 및 유방 X-선 영상에서의 병변 자동판독 [[18]][[19]][[20]] 및 ECG 분석을 통한 심방세동 예측 [[21]] 등 다양한 의료 데이터 분석 문제에서 괄목할만한 성과를 보이며 주목을 받아왔다.
현재의 인공지능 기술은 세간의 오해와 달리 인간 수준의 범용적 사고기능의 구현을 추구하는 범용인공지능(Artificial General Intelligence, AGI) 보다는, 제한적인 조건의 과제에서 인간 수준의 (혹은 이를 뛰어넘는) 업무처리 능력을 확보하고자 하는 약인공지능(weak AI) 관점에서 더욱 활발히 기술개발이 이루어져 왔다. 최근에는 문자인식(Optical Character Recognition, OCR) [[22]][[23]] 및 안면인식(face recognition) [[24]] 등 과제에서 그 가능성을 입증하고 있다. 이러한 관점에서, 인공지능 기술은 인력에 대한 완전한 대체를 목적으로 한다기 보다는 인력의 업무효율을 극대화하는 증강지능(Augmented Intelligence)의 실현이 현실적 목표라고 할 수 있다. 대표적인 의료영상 의료인공지능 스타트업인 뷰노는 판독이 주업무인 영상의학 의사에게도 의료인공지능 기술은 골연령 판독과 같이 번거로운 작업의 효율을 높이면서도 (판독 시간 18~40% 감소) 판독 정확도를 향상 (전문의의 경우 63% → 73%로 상승) 시키는 데이 도움을 주는 것으로 발표했다 [[25]][[26]].
인공지능 기술의 대표적인 방법론인 기계학습/딥러닝의 기술적 목표는 현재 보유한 데이터에 대한 완전한 통계적 분석이 아니라, 미래에 확보하게 될 새로운 데이터에 대한 예측(prediction) 능력을 극대화하는 데에 있다 [[27]]. 특히 딥러닝 기술은 수십만~수백만 개의 파라미터(parameter)를 보유한 대단위의 모델링을 통해 고전적인 기계학습 기술로 구현하지 못했던 매우 고차원(high-dimensional)의 비선형적(non-linear)인 패턴인식(pattern recognition)을 가능하게 한다. 단, 그 수 많은 파라미터를 보유한 모델을 학습시키고 최적화(optimization)하기 위해서는 많은 수의 빅데이터를 학습 및 검증용 데이터로 활용할 수 있어야 한다. 학습 모델이 좋은 예측력 확보를 위해서는 모델의 강인성(robustness) 확보가 관건이며 이를 위한 최고의 방법은 양질의 빅데이터를 활용하는 것이지만, 오히려 이 점이 의료인공지능 개발의 병목 지점(bottleneck)이 되기도 한다. 왜냐하면 의료데이터는 데이터의 질적/형식 표준화, 개인 민감정보 보안, 제한된 수의 환자군 등의 문제로 대단위의 빅데이터를 확보하기 쉽지 않기 때문이다.
의료인공지능 기술의 이해에 있어 가장 유의해야 하는 바는 본 기술의 목표가 세련되고 신선한 인공지능 기술 개발에 있지 않고, “의료” 그 자체에 방점이 찍혀야 한다는 점이다 [[28]]. 통상적으로 알려지고 있는 인공지능 기술의 발전과 의료 데이터를 활용한 수 많은 연구들을 통해, 인공지능 기술이 의료분야에도 적용가능하다는 점은 충분히 증명해왔지만, 실제로 의료 인공지능 기술이 임상에 활용되고 환자들에 대한 진단 및 치료에 의미있는 개선을 가져온 예시는 여전히 찾아보기 어렵다.
의료인공지능 기술의 최종 목적이 환자가 진단을 잘 받도록 하고, 나아가 치료를 잘 받을 수 있도록 의료진을 돕는 것이라는 점을 잊지 말아야 할 것이다. 이와 동시에 의료인공지능 모델이 강인한 예측력을 확보했는지, 그 임상적 유효성은 어떠한지 엄밀하게 검증하는 노력이 필요하다 [[29]].
전 세계적으로 신종 코로나 바이러스 팬더믹을 겪게 되면서, 새삼 의료 인프라의 중요성에 대해서 되새기는 계기가 되었다. 주로 다음과 같은 감염병 대응 과제에 많은 나라들의 의료 인프라 부족 문제가 드러났으며 그 요구가 증대되고 있다 [[30]].
확산 방지를 위하여 감염병의 대응은 신속해야 하므로, 필연적으로 위 과제들은 공통적으로 신속성이 요구된다. 그러면서도 그 목표 달성을 위해 빅데이터 분석이 필요한 과제들이므로 인공지능 기술의 도움이 절실하다고 할 수 있다.
특히 감염병의 예측 및 전파경로/현황을 파악하는데 있어서 IoT 와 5G 등의 차세대 통신망을 활용하여 실시간으로 누적되는 데이터들을 처리하고 분석하는 기술이 필요하다 [[31]]. 대표적으로 ‘Worldometer’ [[32]] 나 US Centers for Disease Control and Prevention (CDC) 와 같은 각국의 질병관리기관에서 신종 코로나 바이러스의 감염 현황이 실시간으로 보고되고 있다. 이러한 데이터들의 실시간 획득과 분석을 통해 지역별로 감염병의 추세나 전파확산 경로 등의 현황을 신속히 파악하는 것뿐 아니라 미래의 상황에 대한 예측을 통해 정부나 기관에서 적절히 대응할 수 있도록 인공지능 기술을 활용하는 것이 필요하다.
신종 감염병의 진단 및 치료법 개발의 신속성은 재차 강조해도 지나치지 않다. 하지만 그 진단 및 치료법의 개발은 현재로서는 전문가로서도 어렵거나 답이 없는 문제를 풀어야 하는 경우가 많아 이 역시 인공지능의 도움이 필요한 영역이라 할 수 있다. 예컨대 신종 감염병과 기존의 알려진 감염병과의 감별진단과 같은 과제는 증상 등의 임상소견에 덧붙여 X-ray나 CT와 같은 영상소견을 포함하여도 전문가로서도 쉽지 않다 [[33]]. 환자의 X-ray나 CT상에서 눈에 보이지 않는 영상 표현형(phenotype)을 정의하고 분류할 수 있는 인공지능 모델을 통해 신종 코로나 바이러스로 인한 폐렴과 기존의 바이러스성 폐렴의 감별진단이 가능하다 [[34]]. 특히 치료제 개발은 현재로서는 답이 없는 문제를 푸는 것으로, 수많은 신약 후보 물질 중에서 가장 유용할 것으로 기대되는 것들을 인공지능을 통해 screening하는 기술로서 신종 감염병의 신약개발을 가속화하는데 일조할 수 있다 [[35]].
또한 의료인공지능 기술의 증강지능으로서의 활용 혹은, 단순한 작업의 대체 효용 측면을 적극 활용한다면 신종 감염병에 의한 의료 resource의 쏠림 현상을 최소화하여 기존의 의료전달체계와 임상 현장에 혼란을 주거나 마비가 되는 것을 방지할 수 있다 [[30]]. 나아가 지금과 같이 판데믹 상황에 의료 resource의 부족까지 겹친 상황에서는 신종 감염병 환자에 치료 효율을 증대시키기 위한 triage도 중요한 기술적 과제중의 하나로, 인공지능 기술을 이용한 환자의 예후 예측 모델을 통해 이를 실현할 수 있다 [[36]].
최근 인공 지능 기술이 전 산업 분야에 걸쳐 다양하게 적용되고 활용되고 있는 것처럼, 감염병 재난 환경에 대해서도 다양하게 활용될 수 있는 많은 가능성들을 갖고 있다. 이러한 이유로, 전세계적으로 많은 기술 연구개발과 응용 서비스 개발이 진행되고 있다 [[89]].
OECD 보고서[[37]]에서는 [그림3]과 같이 COVID-19와의 싸움에 다양한 방역 단계별로 AI 활용이 도움이 될 수 있다고 분석하고 있고, Gartner의 보고서[[38]]에서도 유사하게 1) 조기 발견 및 전염병 분석 2) 격리 3) 심사 및 진단 4) 건강 관리 운영 5) 백신 연구 개발 분야에서 인공지능의 활용 가능성이 높다고 분석하고 있다.
중국 인공지능산업개발연합에서는 중국내 코로나 바이러스 대응을 위해 전염병 상황 모니터링 및 분석, 인력 및 재료 관리 및 제어, 물류 지원, 약물 연구 및 개발, 치료 및 생산 재개 등의 분야에서 인공지능을 활용한 자국내 사례 분석 결과 보고서를 공개하였다. 그리고 감염병 재난 상황이 인공지능 기술의 발전뿐 아니라 다양한 산업 자체를 강화시키는 인공지능의 역할이 확장되고 있다고 분석하고 있다 [[39]].
본 보고서에서는 주요 감염병 방역 단계를 4단계로 구분하고, 각 방역 단계별로 적용 가능한 다양한 인공지능 기술의 활용 예들을 <그림4>와 같이 도출하였다.
이 장에서는 감염병 대응을 위한 인공지능 활용 사례 중 많은 연구개발이 진행되고 있거나 실제 활용도가 높았던 6가지 대표적인 사례들에 대해 보다 상세하게 분석해보았다.
감염병 방역에서 가장 중요한 기술 중 하나는 바로 감염자에 대한 빠르고 정확한 진단이다. 바이러스성 감염병인 코로나19의 경우 실시간 역전사 중합효소 연쇄반응(Real time reverse transcription polymerase chain reaction: RT-PCR)이 표준적인 진단 검사 방법으로 활용되고 있지만, 결과 확인까지 약 6시간 이상이 소요되며, 고가의 전용 장비와 음압환경시설을 갖춰야 하므로 국가와 지역별에 따라 검사에 대한 접근성의 편차가 크다. 또한 감염 초기 잠복기 상태이거나 검체 채취 및 취급 과정의 문제로 인한 RT-PCR검사의 위음성 판정의 사례들이 보고되는 등, 검사 자체의 한계도 보고되고 있다 [[40]]. 이러한 DNA 기반 진단 검사 방법의 접근성과 오류 가능성을 보완하기 위해 다양한 연구와 노력들이 진행되어 왔으며, 그 중 인공지능 기반의 흉부 X-ray와 폐 CT영상 분석 기반 진단 보조 솔루션들이 대안으로 주목받고 있다.
코로나19 감염병의 대표적인 증상인 바이러스성 폐렴은 폐포 손상을 유발하며 손상의 범위나 심각도에 따라 X-ray나 CT등의 흉부 영상 검사로 감염 부위의 관찰이 가능하다. 특히 이번 코로나19 폐렴의 경우 특징적인 영상의학적 소견들을 나타내고 있으며, 간유리 음영(Ground-glass Opacity), 폐경화(Consolidation)의 소견이 양쪽 폐의 후측 주변부에 나타나는 특징을 가지고 있다 [[41]][[42]][[43]]. 또한 폐렴의 진행 경과에 따라 간유리 음영 대비 폐경화의 비율이 높아지다가 회복기에 폐경화 영역이 소멸되는 패턴을 보인다 [[44]]. 따라서 이러한 영상의학적 특징을 인공지능을 통해 학습시키면, 코로나19 폐렴 의심환자의 영상에서 폐렴 소견을 탐지하여 RT-PCR 검사를 통한 진단을 보완하는데 활용할 수 있다 [[45]][[46]]. 또한 감염 여부만을 판단할 수 있는 RT-PCR 검사에 반해 폐렴 소견을 보이는 영역의 범위를 정량화 함으로써 감염병의 중증도를 판단할 수 있으며, 연속적으로 촬영된 영상을 기반으로 치료에 대한 반응이나 질환의 경과도 객관적으로 관찰할 수 있다는 장점이 있다 [[47]]. 뿐만 아니라, 암환자와 같이 주기적인 영상 검사를 시행하거나[[48]] 코로나 감염병 외의 질환으로 시행한 영상 검사를 통해[[49]] 의심환자로 분류되고 RT-PCR을 통해 확진되는 사례가 보고되고 있어, 인공지능 기반 진단 보조 솔루션이 이러한 무증상 환자의 우연적 선별에도 도움을 줄 수 있다.
이러한 목적에 따라 코로나19 확진 환자 데이터를 활용하여 진단 및 정량화 모델을 개발하고자 하는 연구가 활발하게 진행되어 왔는데, 중국 우한의 의료진과 선전의 의료인공지능 기업의 협력 연구팀은 CT영상을 바탕으로 코로나19로 인한 폐렴과 일반적인 지역사회획득 폐렴을 구분하는 인공지능 모델 COVNet을 개발, 영상의학분야 최고권위 학술지인 Radiology에 발표하였다 [[50]]. 최근 뉴욕 사이나이의 아이칸 의과대학(Icahn School of Medicine at Mount Sinai)에서는 CT영상뿐 아니라 열과 기침 등의 증상 및 혈액검사 결과 등의 임상정보를 동시에 활용하여 CT영상만 학습한 인공지능의 정확도뿐 아니라, 흉부 영상 전문의의 판독 정확도를 뛰어 넘는 성능을 보이는 인공지능 모델을 개발하여 의학분야 최고권위 학술지 중 하나인 Nature Medicine에 발표하였다 [[51]].
이에 발맞추어 전세계 의료 인공지능 기업들도 코로19 폐렴의 진단 및 중증도 판단을 지원하는 솔루션들을 개발해 왔으며 [표 1], 국내에서는 뷰노가 흉부 X선 기반의 폐렴 탐지 솔루션과 흉부 CT기반의 폐렴 정량화 솔루션을 패키지 형태로 전세계에 무료 공개하여 200개 이상의 기관에서 활용되고 있다 [그림 5]. 그 밖에도 루닛과 메디컬아이피도 각각 자사의 인공지능 기반 흉부 X-Ray와 흉부 CT 영상 분석 솔루션을 무료 공개하여 주목을 받았다. <부록2>와 같이 이 밖에도 중국을 포함한 다양한 국가들에서 많은 시스템들이 개발되고 있다.
국가 | 기관 | 입력 데이터 | 서비스 URL |
---|---|---|---|
중국 | Infervision | CT | https://global.infervision.com/product/5/ |
미국 | Arterys | X-ray, CT | https://marketplace.arterys.com/ |
미국 | RADLogics | CT | https://www.radlogics.com/coronavirus/ |
한국 | 뷰노 | X-ray, CT | https://covid19.vunomed.com/ |
한국 | 루닛 | X-ray | https://www.lunit.io/en/covid19/ |
한국 | 메디컬아이피 | CT | http://medicalip.com/mobile/shop/covid19.php |
이러한 인공지능 기반 진단 보조 솔루션의 장점에도 불구하고 이를 임상에 현장에 적극적으로 활용하기에는 몇 가지 한계가 있다. 우선 감염병 의심환자의 영상의학 검사를 시행하기 위해서는 기존의 영상 진단검사 장비를 활용하게 되는데, 이때 필요한 검사 장비의 방역 조치 및 검사 후 소독, 검사실의 환기에 많은 인력과 시간 소요되어 선별 검사로서 운용의 효율성이 낮다. 따라서 방역 조치가 간편하며, 공간 운영의 유연성이 있는 이동형 진단 영상 장비와 인공지능 소프트웨어가 통합된 지능형 의료기기 개발의 필요성이 높아지고 있다.
번호 | 링크 | 이미지 유형 | 학습데이터 사례 | 모델 | 정확도 | ||||
---|---|---|---|---|---|---|---|---|---|
COVID-19 (+) | COVID-19 (-) | Pneumonia | Healthy | No finding | |||||
1 | https://arxiv.org/abs/2003.11617 | Chest X-ray | 224 | 700 | 504 | VGG-19 | 93.48 | ||
2 | https://arxiv.org/2003.09871 | Chest X-ray | 53 | 5526 | 8066 | COVID-Net | 92.4 | ||
3 | http://doi.org/10.33889/IJMEMS.2020.5.4.052 | Chest X-ray | 25 | 25 | ResNet50 + SVM | 95.38 | |||
4 | http://arxiv.org/abs/2003.11055 | Chest X-ray | 25 | 25 | COVID-Net | 90 | |||
5 | http://arxiv.org/abs/2003.10849 | Chest X-ray | 50 | 50 | Deep CNN ResNet-50 | 98 | |||
6 | https://doi.org/10.1101/2020.02.23.20026930 | Chest CT | 777 | 708 | DRE-Net | 86 | |||
7 | https://doi.org/10.1101/2020.02.14.20023028 | Chest CT | 195 | 258 | M-Inception | 82.9 | |||
8 | https://doi.org/10.1101/2020.03.12.20027185 | Chest CT | 313 | 229 | UNet+3D Deep Network | 90.8 | |||
9 | https://arxiv.org/abs/2002.09334 | Chest CT | 219 | 224(Viral) | 175 | ResNet + Location Attention | 86.7 | ||
10 | https://doi.org/10.1016/j.compbiomed.2020.103792 | Chest X-ray | 125 | 500 | DarkCovidNet | 98.08 | |||
11 | https://doi.org/10.1016/j.compbiomed.2020.103792 | Chest X-ray | 125 | 500 | 500 | DarkCovidNet | 87.02 |
또한 감염병 진단 보조를 위한 인공지능 솔루션의 정확도 검증을 위해 감염병 확산 초기부터 확진 환자의 데이터를 수집하고 공유할 수 있는 표준 체계 및 플랫폼 구축이 필요하다. 현재 논문으로 발표된 연구나 제공하고 있는 서비스는 제한된 숫자의 병원과 협력을 통해 확보된 소수의 확진 환자 데이터에 기반하여 개발 및 검증이 이루어지고 있다 (표2 참조). 따라서 인공지능 모델의 성능이 일반화되기 어렵고 영상 촬영의 프로토콜이 상이한 경우 성능이 보장되지 않을 가능성이 높다.
이번 코로나19 사태로 경험한 바와 같이, 치료제나 백신이 없는 신종 바이러스성 감염병의 대유행으로 인한 인명 및 경제적 손실을 최소화하기 위해서는 감염병의 유행 초기부터 진단 및 선별을 위한 다양한 기술이 총동원되어야 한다. 접근성이 높은 이동형 진단장비의 개발 및 대량의 데이터에 기반한 폭넓은 검증을 통해, 인공지능 기반의 영상 진단 기술은 향후에도 접근성이 높고 효율적인 진단 도구로 널리 활용될 것으로 기대된다.
2020년에는 SARS-CoV-2의 범유행(Pandemic)처럼 신종 감염병이 다수의 환자를 발생시켜 재난 상황을 유발하는 사례는 2009년의 신종인플루엔자 범유행이 최근에 발생했었으며, 앞으로 점점 증가할 것으로 예측되고 있다.
특히 이번 코로나19의 범유행 사례에서 보면 다수의 국가에서 의료자원의 소진으로 인해 신종 감염병으로 인한 재난 상황이 발생하였다. 많은 국가에서 환자들은 진단을 받지 못하고 자택에 기거하거나, 진단이 되었다 하더라도 경증에서 중등도의 환자들은 의료기관이 아닌 자택 혹은 생활치료시설 같은 비 의료기관에서 격리되는 상황이 발생하게 되었다.
의료기관에 입원한 환자는 상태가 의료진에 의해서 감시되고, 필요시 처치가 이루어질 수 있으나, 자택이나 생활치료시설 같은 곳에 격리된 환자들의 경우는 적절한 감시가 이루어지기 어렵고, 이에 따라 상태가 악화되더라도 적기에 필요한 처치를 받기 어려운 것이 사실이다. 특히, 2020년에 유행중인 코로나19의 사례를 보면 폐렴이 심하게 진행되더라도 환자가 자각증상이 없는 경우 들이 다수 보고되고 있어, 비 의료기관에 격리되어 있는 환자의 상태를 평가하는 것이 필요할 것으로 생각된다.
원격 환자 모니터링의 개념은 과거부터 있어오던 개념이나, 전용장비가 아닌 IoT를 활용한 Smart Device들이 개발되기 시작하면서 조금 더 쉽게 접근할 수 있게 되었다.
먼저 환자의 활력징후 및 산소포화도를 측정할 수 있는 장비들을 보면, 애플워치, 갤럭시워치등에 포함되어 있는 맥박수 확인기능은 광혈류측정기(PPG:Photoplethysomography)를 기반으로 하는 펄스옥시미터(Pulse oximetry)에서 맥박수만 확인하고 있으며, 환자의 심전도를 클라우드에 저장 분석 할 수 있는 S-patch Cardio 같은 Device도 개발되어 시장에 나와 있다. 또한 혈압과 체온을 측정하여 각종 클라우드에 기록을 할 수 있는 스마트 혈압계 및 체온계들도 시장에 다수 출시되어 있다.
이러한 장비들을 활용하게 되면 의료기관이 아닌 자택이나 생활치료시설 같은 비 의료기관에 격리되어 치료받는 환자의 상태를 모니터링 할 수 있다. 하지만, 다수의 환자를 동시에 모니터링 하는 것은 매우 지난하고 어려운 일이다. 의료기관의 중환자실의 경우에도 한대의 중앙 환자 감시장치를 통해서 동시에 감시가 가능한 환자수는 고작 30명 남짓하며, 이 경우도 설정된 임계값(Critical Value)를 벗어나서 경고가 울리지 않는 한 환자의 상태가 나빠지는 것을 발견하는 것은 매우 어렵다. 현실적으로, 한 장소에 모여 있는 환자도 아닌 다수의 장소에 개별로 격리되어 있는 수많은 환자의 상태를 실시간으로 모니터링 하는 것은 인공지능의 도움없이는 어려운 일이다.
이러한 다수 환자의 감시를 위해서는 인공지능에 의한 감시(Surveillance)가 필수적이라 할 수 있다. 환자가 착용하고 있는 각종 스마트디바이스에서 발생하는 이벤트들을 인공지능이 감시하고 필요시 이러한 이벤트들을 관리자에게 통보하거나, 응급의료체계(EMS: Emergency medical system)를 활성화시키는 등의 기능을 해야만 효율적으로 다수의 환자들의 안전을 도모할 수 있을 것이다.
여기에 활용할 수 있는 가능성이 높은 기술은 뷰노와 세종병원이 함께 개발하여 여러 기관에서 사용하고 있는 DEWS(DeepEWS)가 있다 [[112]][[113]]. 쉽게 측정할 수 있는 체온, 수축기혈압, 호흡수, 심박수 네가지 인자만을 사용해서 심정지예측을 하는 인공지능 기반의 Alert 시스템으로 자택 혹은 생활치료센터에서 격리되어 있는 환자들에게 적용하여, 환자의 상태가 급변하는 것을 예측하고 예방할 수 있을 것이다. 또한, PPG를 기반으로 하는 산소포화도 감시 또한 이번 코로나19 같은 폐렴을 유발하는 전염성 질환에서 환자의 상태를 감시할 수 있을 것이다.
국제적으로는 스위스 집중 치료 의학 협의(SGI/SSMI )의 후원으로 진행되고 있는 RISC-19-ICU 레지스트리에 현재 16개국 97개 센터가 참여하여 ICU에 있는 COVID-19 중환자들의 특성과 치료 과정에 대한 EHR 정보를 공유하는 작업을 진행하고 있다. 이를 통해 환자의 위험도를 계층화하고 AI/ML 기술을 이용해 합병증과 발생할 위험을 예측하고 예방할 수 있도록 하는 것을 목표로 하고 있다.
이번 코로나19유행에서 치료제 후보 군으로 큰 관심을 가지고 있는 Chloroquine 계열의 약물. 특히 Chloroquine phosphate 및 Hydroxychloroquine은 용량을 잘 조절하지 못하면, 부정맥을 유발할 수 있는 것으로 잘 알려있으며, 함께 사용하는 것이 검토되었던 Azithromycin의 경우도 QT 간격을 연장시켜 부정맥의 위험을 높이는 약물이다. 이 경우 발생되는 부정맥은 다형심실빈맥으로 최악의 경우 환자가 목숨을 잃을 수도 있다. 미국에서는 실제로 이 약물을 자가 투약한 환자가 사망하는 사례도 발생하였다. 이러한 부정맥을 유발할 위험이 있는 약물로 치료받는 환자들은 병원에 입원하여 심전도를 감시하에 투약하는 것이 안전하지만, 다수의 환자가 발생하여 모든 환자가 병원에 입원치료를 받을 수 없는 상황에서 외래 투약시에는 S-patch Cardio 같은 장비를 활용하여 심전도 감시를 하고, 필요시 응급의료체계를 자동활성화 시켜 구급대를 출동하게 하는 등의 조치를 취하는 것이 필요하다.
현재 유행중인 코로나19의 진단 및 치료에 도움을 줄 수 있는 기술 및 환자 상태의 급변을 감시할 수 있는 여러 기술들은 시장에 출시되어 있으나, 감염성 질환의 예후를 예측할 수 있는 기술은 아직 현장에 나와 있지 않다. 예후 예측을 위해 필요한 각종 데이터들을 수집해서 분석해야 우리가 아직까지 실체를 잘 알지 못하는 이러한 신종 감염병의 예후 인자들을 찾아낼 수 있을 것이다. 그러기 위해서는 환자유래의료데이터 (Patient Generated Health Data, PGHD)와 유전체 정보 (Genomic Data)를 아우를 수 있는 개인건강기록 (Personal Health Record, PHR)이 반드시 필요하다고 하겠다.
코로나 바이러스 팬더믹과 같은 전염성과 치명률이 동시에 높은 감염병의 등장으로 의심 환자와 신규 환자에 대한 비대면 진료와 원격 진료, 그리고 AI를 통한 사전 스크리닝과 모니터링의 필요성이 커지고 있다. 미국, 일본, 영국 등 각국에서는 긴급하게 원격의료에 대한 규제를 완화시키면서 대응하고 있고, 의심 환자와 신규 환자를 효과적이고 안전하게 접촉하고 진단검사를 시행하는 방법과 절차 개발들을 개발하고 있다.
이러한 상황 속에서 주목받고 있는 것이 AI 기술을 기반으로 하는 대화형 인터페이스 기술과 음성 인식 기술이다. 대화형 인공지능 응용은 챗봇(chatbot) 및 이를 이용한 가상개인비서(VPA: Virtual Personal Assistants), 가상고객비서(VCA: Virtual Customer Assistants), 가상직원비서(VEA: Virtual Employee Assistants) 등으로 구성되며, 핵심기술로는 음성인식/음성합성/언어처리/상황인지 및 대응/감정인식/지식 베이스/대화 모델링 및 인터페이스 기술 등을 종합적으로 활용한다.
코로나 바이러스 팬더믹 상황에서 많은 국가들이 감염 상태에 대한 사전 문진과 가이드를 위해 핫라인 전화를 개설 운영하였었으나, 확진자 증가량에 비례하여 문의 전화가 폭증하고 대기 시간이 길어지고 연결이 끊기고 불가능해지는 등 다양한 전화 폭주로 인한 문제들이 발생하였다. 이러한 문제를 해결하기 위해 자동화된 대응을 위한 대화형 인터페이스 기술 활용이 늘어나고 있다 [[52]].
전화보다 효과적인 사용자 커뮤니케이션의 필요성에 따라 다양한 국가들에서 챗봇을 활용한 질문 상담과 사전 문진을 시행하고 있다.
웹과 모바일 앱 기반의 대화형 챗봇은 사용자 타이핑 기반의 커뮤니케이션에는 유용하지만 음성 인터페이스 보다는 덜 직관적이라 할 수 있다. 또한 사용자 중심이 아니라 방역 당국에 의해 모니터링과 관리가 필요한 환경에서는 음성 통화 기반 모델이 보다 효율적이라 할 수 있다. 이러한 이유로 자가 격리자 모니터링 및 관리 등의 목적으로 다양한 음성 기반 서비스들이 개발되어 활용되고 있다.
음성 지원 에이전트는 통화 대상자 관리/음성인식/음성합성/언어처리/상황인지 및 대응/감정인식/지식 베이스/대화 모델링 및 인터페이스 기술 등을 종합적으로 활용한다.
음성으로 전자 의무 기록과 전자 간호 기록을 작성하고 환자 정보 등을 검색할 수 있도록 하는 다양한 도구 들이 등장하고 실제 의료 환경에 적용되고 있다. suki.ai와 같은 경우에서는 COVID-19에 특화된 템플릿을 제공하는 시도도 하고 있다.
국내의 경우 뷰노에서 개발한 ‘뷰노메드 딥에이에스알(VUNO Med®-DeepASR™)’와 셀바스AI에서 개발한 셀비 메디보이스(Selvy MediVoice)와 같이 음성 녹음부터 자동 Text 변환, 교정 및 저장까지 의료녹취를 위한 모든 과정을 지원하는 통합 의료 음성 인식 솔루션을 비롯해 은평성모병원 등에서 적용한 ‘음성인식 전자간호기록(Voice ENR) 같은 사례가 있다.
기타 다양한 소리를 이용한 인공지능 기반 진단 연구들도 진행되고 있다.
대화형 인터페이스를 사용하는 자동화된 도구들은 감염병의 급속한 확산의 최접점에서 의료진과 사용자 모두에게 도움을 줄 수 있다. 대화형 인터페이스 기반의 서비스들은 중요 정보의 안내, 증상 진단과 모니터링, 행동변화 지원, 정신 건강 지원 등을 할 수 있다 [[54]]. 대화형 인터페이스의 보다 적극적인 활용을 위해서는 신뢰할 수 있는 체계화된 정보 제공 방법, 서로 다른 시스템(챗봇, 음성 지원)과 기기(스피커, 스마트 기기)들을 연결할 수 있는 방법, 진단용의 경우 성능 평가 방법 등에 대한 개선 노력과 추가 연구들이 필요하다.
폭풍이나 홍수를 단지 몇 분만 빨리 예측할 수 있어도, 많은 사람들을 부상이나 사망의 위협으로부터 구할 수 있다. 하지만, 신종 코로나바이러스 (SARS-CoV-2) 등의 전염성 질환으로 인해 일어나는 여러 사회 경제적 파급 효과는 쉽게 가늠하기 어렵다.
현재 코로나바이러스 관련 모델은 크게 확진자, 사망자, 입원환자 등의 자료를 토대로 수학적으로 데이터의 특징을 잘 반영시키는 방법을 찾아내는 statistical model, 그리고 큰 질병이 생기는 경우에 사람들은 어떻게 행동하고, 질병은 어떤 방식으로 전달되는가를 연구하는 mechanistic model 두 가지로 나뉜다. 이 두 가지 모델링 방법은 서로 상호 보완적이며, 한 모델의 예상되는 결과가 다른 모델의 성능에 영향을 미치는지를 분석할 수 있다. 최근에는, 머신러닝을 이용한 시계열 예측 모델로 이런 두 가지 모델의 장점과 단점을 조합해서 여러 예측을 하고 환자 진료부터 정책 수립에까지 도움을 주려는 시도가 많아지고 있다.
다만, 인공지능을 이용한 질병, 특히 신종 코로나바이러스의 예측 모델에서 가장 주의해야 할 점은, 이 모델들을 설계하기 위해 여러 가지 수학적인 가정이 필요하고, 모든 모델은 적합한 데이터가 필요하며, 많은 경우 후향적 시험을 통해 검증이 되어야 하고, 그 후에도 실제 상황에서 전향적으로 사용하는 단계에서는 뚜렷한 한계가 있다는 점이다. 이 단원에서는 이런 한계점들과 극복 방안들을 알아보고자 한다.
모델의 종류와 관계없이 입력 데이터가 전산화되어 있지 않거나, 데이터의 품질이나 인터벌이 균일하지 않은 경우, 모아야 할 데이터에 대한 충분한 컨센서스가 없는 경우, 데이터의 표기법이 집단별, 혹은 기관별로 상이한 경우, 데이터를 모으는 훈련받은 전문 인력이 부족할 경우에 입력 데이터의 품질 문제가 생기게 되며, 이 문제를 해결하는 전처리 단계의 인력과 비용의 소모가 크며, 무엇보다도 짧은 시간 안에 모델링을 해야 하는 경우에는 기민한 대처가 불가능하다. 따라서, 무엇보다도 먼저 여러 의료 기관의 절차 및 데이터 표준화 작업이 선행되어야 한다. 비정상적인 데이터의 흐름이 과연 중대한 신호인지 혹은 의미없는 소음인지를 판정하고 거르는 방법이 각 센터나 기관마다 다르지 않도록 평시에 표준화 작업을 함으로서 어느 정도 해결할 수 있다. 분석 서버 (analytic server)를 미리 마련해 두고, 수집 가능한 데이터는 필요에 맞게 전처리와 특징 추출을 해 놓는 것도 예측 알고리즘의 빠른 적용에 도움을 줄 수 있다. 반대로, 단위가 정해지지 않은 집단적 대단위의 예측을 위해서는 클라우드 공간에 데이터 풀을 만들어서 무작위적인 데이터를 수집하는 방법이 있다. 아마존의 AWS Public Data Lake [[55]] 와 같은 경우, AWS 계정 를 가진 사용자 누구나 아마존에서 수집해서 정리된 데이터 서버에 있는 자료들을 이용해 예측 모델을 개발할 수 있다. 이런 데이터 풀을 이용하는 경우 개개 데이터의 품질는 떨어질 수 있지만, 데이터 전체의 흐름은 거시적으로 실제 현상에 수렴하기 때문에, 예측 모델의 용도에 따라 좋은 데이터 소스로 작용할 수도 있다.
특별히 질병의 전파 예측을 하는 경우, 여러 기관에서 공유하고 있는 데이터를 모아서 써야 하는 경우가 많다. 이 경우 데이터를 통합 서버로 보내는 대신, 학습된 모델을 각 데이터가 있는 서버로 보내고, 학습된 결과를 받아서 모델을 업데이트 시키는 연합학습 (federated learning) 기법이 이용될 수 있다 (그림7) [[56]]. 이는 데이터의 프라이버시 문제를 해결하며, 동시에 각 센터의 데이터 거버넌스 문제도 다룰 수 있게 한다. 연합학습의 개발 초기에는 모델의 신뢰도 (받은 데이터로 모델이 올바로 학습되었는지 알기 어려움) 와 데이터의 전송 속도 (학습된 결과가 양이 방대할 경우 실시간 추적이 어려워짐) 가 문제가 되었지만, 데이터 표준화가 진행되고, 5G 네트워크 등의 고속 전송 등을 통해 기술적 문제들은 해결이 가능하다고 할 수 있다.
그리고, 유전체 데이터 표준화를 진행하는 GA4GH에서는 “Responsible Data Sharing to Respond to the COVID-19 Pandemic”이라는 제목으로 COVID-19 해결을 위한 다양한 연구활동에서 데이터 공유를 위한 전세계 연구자들의 공동 선언문을 작성하고 있는 중이다. 연합학습과 같은 기술적 대안과 더불어 연구 윤리 측면에서 고려해야 하는 점들을 제시하고 있다.
전염병의 전파를 예측하는 일에 가장 전통적으로 사용된 수학적 모델은 시계열 상에서 환자의 상태 변동을 조사하는 susceptible (S), exposed (E), infected (I), and resistant (R) 과 같은 컴파트먼털 모델 (compartmental model) 이다 [[57]]. 하지만 현재의 코로나 바이러스의 확산과 같은 모델의 경우에도, 전형적인 확산 경로를 따르지 않거나, 국가에 따라 데이터를 투명하게 공개하지 않는 경우, 모델 파라미터들을 결정하는 과정이 용이하지 않기 때문에 알고리즘에 오차가 많이 생기게 된다. 현재 활발하게 관련 연구를 하고 있는 미국의 대학들의 연구들 (University of Washington, Seattle [[58]]; University of California, Los Angeles [[59]]; Harvard University, Boston [[60]]) 의 예측 결과가 매우 다른 것도 이 때문이다. 이 문제는 1) 감염병의 시계열 추이를 정확하게 볼 수 있는 데이터의 수집과 투명한 공개, 2) 감염병이 퍼진 지역과 다른 지역의 문화/인종적 차이를 고려한 모델 설정, 3) 시계열 변이를 지속적으로 모델 업데이트를 통해 반영하는 작업을 통해 어느 정도 극복할 수 있다. 그 후 머신 러닝 모델에서는 비지도학습 모델을 통한 추이 클러스터링을 통해 향후의 가능한 변화들 여러 가지를 도출해 낼 수 있다. 이런 예측으로, 필요한 곳에 진단 시약, 물자, 의료장비, 인력 등의 공급을 원활하게 할 수 있고, 또한 사회적 거리 두기 등의 예방적 조치를 강구할 수 있다.
신종 감염병인 경우, 감염자들의 임상적 행태는 물론, 의료진들의 치료 방법을 예측하는 일 또한 매우 까다롭다. 현재 코로나바이러스 감염증의 경우도 초기에 전 세계 의료진들은 각각 다른 진료 지침과, 약물 사용과, 인공 호흡기 사용 가이드라인에 의지해야만 했다. 이런 경우 가장 유효한 예측을 할 수 있는 전통적인 전향적 임상 실험인 무작위 대조 시험(randomized controlled trial)은 그 시간과 비용, 그리고 임상 실험에 참가한 개개의 환자에게 미치는 영향때문에 신종 감염병에 대해 기민한 대응을 할 수 없다. 미국 여러 센터에서 현재 동시다발적으로 행해지는 전향적 적응성 임상 연구(Randomized, Embedded, Multifactorial Adaptive Platform Trial) 기법을 통한 감염증 환자들의 치료 기법 확립 프로젝트 [[61]] 의 경우, 머신러닝을 통해 환자의 분배와, 여러 가지의 진단과 치료 방법에 대한 동시다발적인 분석을 통해 유효한 결과를 가지는 환자 군을 빠르게 분석해 낼 수 있다는 점에서 이런 한계를 극복할 수 있는 모델이 될 수 있다.
현재 전 세계를 걸쳐서 가장 보편적으로 자리잡은 코로나바이러스 감염 방지 기법은 사회적 거리 두기 (social distancing) 이다. 대부분의 나라에서 경제 활동 규모와 인적, 물적 교류를 줄여가면서까지 이 방법을 쓰는 이유는, ‘커브를 낮춘다 (flattening the curve)’ 라고 하는, 단위 시간동안 신규 확진 환자의 발생률을 줄이는 것이, 현재 가용한 의료 시스템을 통해 환자의 회복을 제 때 도울 수 있다고 믿고 있기 때문이다 (그림8) [[62]]. 하지만 최근 도출된 사회적 거리 두기의 영향에 대한 역학 발표에 의하면, 질병 전파성 (R-naught; R0)과 질병의 치명률에 따라 이 사회적 거리 두기의 효과는 상당 부분 바뀔 수 있다.
현재의 코로나바이러스와 같은 정도의 전파성과 치명률을를 가지는 질환의 경우, 경우 사회적 거리 두기 하나만으로는, 상당한 시간이 지나서 조치를 완화했을 때 감염증이 다시 악화될 수 있기 때문에, 마스크 쓰기 등의 개인 위생, 광범위한 진단적 검사 시행, 그리고 개인의 프라이버시를 철저히 보호한다는 전제 하의 확진 환자의 이전 동태 파악을 통한 모든 방법이 유기적으로 결합되어야만 조절될 수 있다 [[63]]. 한국 이외의 국가들에서 이와 같은 시스템을 효과적으로 구축하는 데 도움을 줄 수 있다면, 향후 다른 종류의 감염병 확산에도 기여할 수 있다.
역학조사(疫學調査, epidemiologic investigation)는 인구집단을 대상으로 특정한 질병이나 전염병의 발생 양상, 원인, 전파경로 등을 조사하는 것을 의미하며, 이를 통해 감염병의 종류와 원인, 발생 경로를 찾아내 대응할 수 있도록 하기 위한데 그 목적이 있다 [[92]].
감염병 재난 상황에서는 정밀하고 정확한 역학조사도 중요하지만, 신속한 역학조사가 더욱 필요하다. 역학 조사 후 적극적인 방역 조치 수행을 위해서는 감염원과 감염 의심 대상을 찾아내 격리 치료하는 것이 중요하다. 이를 위해서는 확진 환자의 동선별 접촉자 를 적극적으로 파악하여 감시조치를 시행하며, 밀접 접촉자를 찾아내 격리하는 것이 확산 방지에 효과적일 수 있다 [[92]].
그러나 수작업으로 접촉자 파악과 추적, 모니터링을 위해서는 많은 인력들이 필요하다는 문제가 있다. 이에 ICT 기술과 인공지능 기술을 이용해 동선별 접촉 가능자를 빠르게 분석해내고 격리 치료 모니터링을 유도하기 위한 다양한 접촉 추적 시스템을 우리나라를 비롯해 오스트리아, 중국, 이스라엘, 폴란드, 싱가포르 등 많은 국가에서 개발하여 사용하고 있다. 나아가 핫스팟 분석 및 알림, 포괄적 봉쇄, 영업정지, 공공장소 폐쇄, 자발적 사회적 거리두기 요청, 이동 제한 조치 등을 시행하고 관리하기 위해 기술들을 사용하고 있는데, 감염병은 주로 신체 접촉과 호흡기 비말로 전파되기 때문에 휴대폰 위치 추적을 통한 위치 데이터를 핵심 데이터로 활용하고 있다 [[93]]. 이외에도 신용카드 사용내역, CCTV, 안면인식, QR코드 등과 같은 다양한 접촉자 확인에 필요한 정보들을 취합 분석하기 위한 앱과 시스템, 그리고 빅데이터 분석과 AI 알고리즘들을 적용하고 있다 [[94]].
한국 정부는 밀접 접촉자 추적을 위하여 역학 조사 지원시스템을 개발하여 활용하고 있다 [[91]]. 지난 4월에 공개된 「코로나19 역학조사 지원 시스템」은 「감염병 예방 및 관리에 관한 법률」에 따른 역학조사 절차를 자동화하는 시스템으로, 대규모 도시 데이터를 수집·처리하는 스마트시티 데이터 허브 기술을 기반으로 국토부에서 개발하였으며, 현재 질병관리본부에서 시스템을 이관 받아 코로나19 역학조사에 활용하고 있다. 본 시스템을 통해 종전 대부분 수작업으로 이루어졌던 28개 관계 기관간 공문 작성 및 유선 연락 등 확진자 정보 수집·분석 과정이 전산화·자동화되어 신속성과 정확성이 크게 제고되었다 [[95]]. 이 밖에도 ‘자가격리자 안전보호 앱‘ 과 ’모바일 자가진단 앱’, 다중이용시설 출입자 확인용 QR코드 전자출입명부 등도 함께 운영하고 있다 [[91]].
싱가포르의 SQREEM 사가 출시한 AI 기반의 실시간 접촉 추적 및 통신 시스템인 SQREEM COVID 추적 플랫폼은 개인 정보 보호 기능을 갖고 있으며 별도 앱이 아닌 AI 및 머신 러닝 모델을 사용해 일정 기간 동안 감염된 환자와 밀접 접촉을 한 다른 사람들을 찾고 잠재적인 감염 클러스터를 식별한다.
해외 국가들에서는 스마트폰을 대상으로 하는 다양한 COVID Tracing Tracker 앱을 개발하여 운영하고 있다 [[96]][[97]][[101]]. 현재 29개국 이상에서 정부 기관을 중심으로 관련 앱들이 개발되어 배포되고 있으며 대부분 근접 통신 기술인 Bluetooth를 기반으로 DP-3T , Google/Apple 프로토콜 [[102]]을 사용하고 있고, GPS 위치 데이타와 데이터마이닝 기술도 함께 활용하고 있다 미국의 경우, CDC에서 디지털 접촉 추적 도구의 평가를 위한 최소 기준을 가이드 하고 있기도 하다.
표 3: 국가별 COVID Tracing Tracker [데이터 출처: Tate Ryan-Mosley 31)를 재구성]
그러나 휴대폰 앱 기반의 접촉자 추적 시스템은 스마트폰 소유자의 80 % 이상이 설치해야 정확성을 가질 수 있지만 강제 설치가 어렵고 자발적 설치 비율이 40%를 넘지 않는다는 문제와 휴대폰을 소유하지 않은 사용자들은 추적할 수 없다는 한계를 갖고 있다 [[109]].
한국 사례와 같이 다양한 데이터들을 종합적으로 활용하면 보다 정확한 접촉자 분석과 모니터링 뿐만 아니라 여행 패턴 예측, 향후 발생 핫스팟 예측, 감염 전개 방식 등을 종합적으로 분석 예측해볼 수 있다. 그러나 한편으로는 AI와 빅데이터를 활용한 모니터링 시스템을 통한 프라이버시 침해와 정보 오남용, 보안 위협 등에 대한 다양한 우려들도 나오고 있다 [[94]][[97]][[98]][[99]]. 특히 아시아권과 달리 시민 개인의 권리 보장와 자유 보호에 대한 규제와 저항감이 높은 유럽/미국 등에서는 이에 대한 우려가 더 높은 편이다 [[100]][[107]].
이러한 이유로 프라이버시 보호를 강조하면서 중앙 집중화되지 않고 분산되고 익명화된 접촉자 추적 및 접촉 확인 기술 개발에 대한 시도들도 다양하게 이루어지고 있다 [[99]][[110]].
주목할만한 연구 중 하나는 캐나다 몬트리올에 위치한 밀라(Mila) 연구소에서 진행하고 있는 P2P 기반의 인공지능 추적 기술이다 [[103]]. 디지털 접촉 추적이 계속 확장될 것으로 예상되는 상황에서, 프라이버시가 보장되는 분산 P2P 기반의 추적 환경에서 딥러닝 기술을 활용하면 단순한 추적 기능을 개선해 상호 작용 거리 및 지속 시간, 자체 보고된 동반 질환, 인구 통계 및 증상의 존재 여부와 같은 특징들을 고려해 개개인의 위험도를 좀더 정확하게 정량화해서 제공할 수 있고, 정량화된 위험도에 맞는 적절한 필요 조치들도 빠르게 안내할 수 있다는 장점을 가질 것으로 기대하고 있다 [[104]].
이러한 P2P 근거리 분산 접촉 추적 기술과 딥러닝 기술의 결합은 새로운 시공간 전염병 확산 모델링 과도 결합되어 실시간 모델링 및 추적이 가능한 형태도 만들 것으로 예상된다.
디지털 추적 시스템들과 인공지능 기술의 결합이 늘어남에 따라 감시 강화로 시민의 권리가 약화되거나, 부적절한 정보와 힘을 정부나 민간 기업이 손에 넣어 불평등을 심화시키거나, 잘못 학습된 편견/편향/차별 등이 적용되면서 공정하지 않은 방식으로 동작될 수도 있다는 우려도 높아지고 있다. 디지털 추적 시스템을 통해 얻을 수 있는 장점도 중요하지만, 동시에 신뢰성을 확보하고 윤리적인 고려사항들이 충실하게 반영되는지 검토되어야 한다는 지적들도 높아지고 있다 [[97]][[[105]][[106]][[107]][[108]]
이에 미국 NSCAI에서는 감염병 대응을 위한 인공지능 시스템에 대한 개인 정보 및 윤리 권고 기준을 만들어 공표하였다. NSCAI에서는 “시민의 자유를 최우선으로 고려하여 개발할 것” 과 “편향되지 않고 불공평한 결과를 제공하지 않도록 개발할 것” 을 권고하면서, 12가지 모범 사례를 함께 제시하였다 [[105]]. 앰네스티를 비롯한 100여개의 국제시민사회단체는 “전염병 퇴치를 위해 디지털 감시 기술을 사용하는 국가는 인권을 존중해야 한다” 는 공동 시민 사회 성명서를 발표하면서 8가지 조건 – 1) 합법적이며 비례적 감시 조치 2) 시간 제한적 감시 시행 3) 수집 데이터의 사용 목적 제한 4) 정보 보안 조치와 익명화 5) 소외와 차별 위험 해소 6) 데이터 상업적 활용시 투명한 계약과 감시 보장 7) 책임 보호와 남용 방지 조치 8) 이해당사자와 전문가 의견 수렴과 적극적 참여 보장 - 이 충족되기 전에는 모든 정부가 디지털 감시와 추적을 강화하지 말 것을 요구했다 [[106]]
많은 사람들이 우려하고 있는 것처럼 앞으로 정부 차원의 강화된 디지털 접촉자 추적 및 모니터링 기술 강화를 요구할수록 프라이버시 침해의 가능성은 높아질 것이다. 이를 해결하기 위해 디지털 접촉자 추적 기술 사용시 국제적인 정보보호 가이드라인 준수와 익명화, 분산화, 데이터 수집 최소화, 데이터 저장기간 제한, 정보 주체의 자기결정권 존중 등에 대한 충분한 고려가 함께 이루어져야 할 것이다.
동시에 기술적으로는 근거리 분산 통신 기술 기반의 디지털 접촉자 기술 개발과 더불어 다양한 디지털 접촉 데이터 및 시스템을 통합할 수 있는 기술 보완도 필요하며, 인공지능 기술 적용시 편견과 차별 방지를 위해 필수적인 AI 신뢰성(Trustworthiness) 기술/표준 확보 노력도 지속해야 할 것이다. 그리고 마지막으로 가장 중요하게는 이런 모든 디지털 추적 조사 기술의 범위는 공중보건 전문가와 함께 과학적으로 검증되어야 하며, 정보의 공개 범위는 최소화되도록 신중하게 고려되어야 할 것이다.
신약 개발의 경우, 보통 2~5년간의 후보 약물 발굴을 거치고, 그 이후로도 6년에서 15년간의 약물 개발 과정을 거쳐야 시장에 출시가 가능하다. 이러한 장기간의 후보 약물 검색 기간과 전임상 연구, 독성 연구가 필요하기에 많은 비용과 시간이 소모되기 때문에 AI를 이용한 다양한 신약 파이프라인 플랫폼 연구개발이 진행되고 있다 [[10]][[113]]. 이러한 기술은 약물 검색 기간과 전임상 연구 및 독성 연구 등의 시간을 단축시키기 위한 중요한 툴로서 사용된다.
신종 감염병인 COVID-19에 대응하기 위한 치료제의 개발을 위해, WHO 필두로 세계 곳곳에서 글로벌 기업을 비롯해 국가적 차원에서의 많은 투자와 연구개발이 진행되고 있다 [[6]][[35]][[113]]. 현재 2020년 6월 7일을 기준으로 7백만명의 감염자와 40만명의 사망자를 내고 있는 시점 [[114]] 에서 치료제나 백신이 공식적으로 개발되어 공급되기 전까지, 대부분의 국민들은 사회적 거리두기나 위생관리 개념에서의 수동적 감염 예방이 유일한 해결책이며, 이는 경제적, 사회적으로 상당한 피해를 가지고 온다. 따라서 한국을 비롯하여, 많은 국가들이 치료제를 찾기 위한 노력을 하고 있다.
현재 최적화된 치료제는 아니지만, 렘데시비르 [[115]][[116]][[117]], 클로로퀸과[[118]][[119]] 히드록시클로로퀸[[120]], 리토나비르/로피나비르[[121]][[122]] 그리고 리토나비르와 IFN-a[[123]]와의 병용치료 등이 COVID-19의 치료를 위한 후보 군으로 연구 중이다. 정확한 임상결과를 토대로 하여 치료제확보를 위한 생산가동이 집중적으로 이루어질 것으로 기대한다. 실험을 토대로 항 바이러스 효과를 확인하는 것이 가장 적합한 방법이지만, 바이러스를 배양하고, 바이러스에 감염된 FCWF-4세포 등에 다양한 치료제를 적용하여 항바이러스효과를 검증까지, 시간과 비용 그리고 기술적인 셋팅과 기전확인까지 빠른 시일 내로 검증하는데 어려움이 있다.
현재까지의 유행 상황을 해결하기 위해서 환자에게 효과가 있는 시판 중 약물을 확인하기 위하여 인공지능 (AI) 기술이 적용되고 있다. 특히 약물의 용도변경을 통한 치료방법은 새로운 약물에 대한 독성등이 이미 보고된 상태에서, 약물의 효능을 기대하는 방법으로, 시간과 비용을 상당히 단축할 수 있을 뿐만 아니라, 약물 생산 인프라가 갖추어져 있는 제약회사로 하여금 신속한 생산을 기대할 수 있다.
인공지능 (AI) 플렛폼의 성공적인 적용을 위하여 알고리즘을 ‘훈련’하기 위한 데이터의 정확도가 중요하다. 현재까지도 타겟이 되는 COVID-19에 대한 제한된 수준의 데이터가 현재 수준에서의 인공지능 플렛폼의 적용은 도전적인 성격이 높다. 현재 이러한 도전을 진행하고 있는 대표적인 인공지능 기반 플렛폼을 통해 COVID-19에 대한 치료제를 개발하고 있는 회사들이 있으며, 이들이 가진 인공지능 기술에 대하여 살펴 보았다.
BenevolentAI [[124]]는 최근 COVID-19를 타겟으로 한 Baricitinib이 중요한 약물후보군임을 밝혔다. 영국에 본사가 있는 이 회사는 캠브리지대학과 함께 관련 빅데이터에 대한 분석 및 알고리즘을 개발하고 있으며, 특히 기존의 문헌을 토대로 하여 데이터마이닝과 데이터필터기술을 통해 좀더 정확한 데이터베이스구축을 수행한다 [125]. 고품질의 데이터베이스를 토대로 하여 심층신경망모델 및 symbolic AI를 적용하고 있고, 분자수준의 분석을 토대로 하여 기존의 약물의 리포지셔닝뿐만 아니라, 약물후보군을 도출할 수 있는 시스템을 가지고 있다 [[125]].
기본정보 | 기술현황 | |
---|---|---|
BenevolentAI | 영국에 본사가 있으며, AI약물발굴 업체로서 상당한 경험이 있음. 최근 AAK1, GAK, JAK1/JAK2 억제제인 Baricitinib (Olumiant)가 COVID-19에 효과적임을 확인 이를 기반으로 임상 진행 중 | 문헌을 근거로 한 데이터마이닝기술과 네트워크분석기술, 그리고 단백질 및 컴파운드의 분자의 머신러닝기반의 분석을 가지고 있음. 특히 자체적으로 빅데이터로부터 데이터추출 및 정제기술 (그래프컨볼루션신경망)을 통해 노이즈가 낮은 데이터 마이닝 기술이 장점임. 더불어 분자설계모델에 대한 벤치마킹 프레임 워크, GuacaMol이 구축되어있어 지속적인 모델의 업데이트가 유지되고 있음. 사용하고 있는 머신러닝 알고리즘은 심층신경망 모델 및 symbolic AI를 균형있게 사용하고 있음. 특허등의 원천기술에는 질병에 관련된 치료제 후보군에 대한 특허가 보유되어 있으나 AI에 대한 원천 기술등이 공개되지 않음. |
Innoplexus | 독일/미국/인도에 회사가 있으며, 환자데이터를 토대로 하여 COVID-19에 대한 치료제 후보군으로 클로로퀸이나 렘데시비르 등에 대한 잠재력을 평가하였으며, 이밖에 다양한 약물들을 도출하였음. | Innoplexus에서 개발한 독자적 인공지능 플랫폼과 빅데이터 (300테라바이트)그리고 수 천명의 환자데이터를 대상으로 AI 플랫폼에 적용하였다. AI플랫폼은 발현데이터, 분자의 경로, 약물결합 친화도, 임상데이터가 적용됨. 이번 2019-nCoV분석에 인간과 바이러스 단백질의 표적 식별을 위해 생물학적 데이터 전체에 걸쳐 구축된 학습데이터와 약물경로 상호작용을 분석하였을 뿐만 아니라, 병용치료용 약물을 확인하기 위한 조합 결과등을 같이 확보하고 있음. 이들이 보유하고 있는 특허들은 블럭체인을 이용한 기밀데이터의 통합관리시스템, PDF파일에서 데이터를 추출 하기 위한 시스템, 네트워크 분석 등이 포함되어 있음. |
VantAI | 미국의 뉴욕에 본사가 있으며, 최근 2019-nCoV의 감염관련 300개의 리드 물질을 선별중임. | VantiAI플랫폼은 생물물리학을 기반으로 한 단백질 상호간의 모델링을 하고 있음 |
INNOPLEXUS는 Gunjan Bhardway 박사를 필두로 설립된 인공지능기반 플렛폼은 지닌 회사이다. 약 300명의 다분야 팀 전문가들로 구성된 이 팀은 독일 및 미국 등지에 회사가 있으며, 특허는 약 100여개, 분석을 위한 임상/생명관련 빅데이터는 약 300테라바이트에 육박한다 [[126]]. 약물 용도변경, 리드물질발굴, 치료타겟 식별 등에 대한 전문성 [[127]]을 가진 이 팀에서는 클로로퀸, 렘데시비르, 클라리트로마이신 단독 혹은 병용치료에 대한 조합을 환자의 데이터를 토대로 예측하였고, 더불어 in vitro 스크리닝을 통한 검증을 통해 가장 적합한 약물 후보군을 제안한 회사이다.
VantAI는 미국에 본사를 두고 있는 회사로서, 감염과정에서 확인되는 바이러스 유래 단백질과 이와 연관된 인간의 500개 이상의 단백질의 상호작용을 이해하기 위한 시스템생물학기반의 접근법을 가지고 있다 [[128]]. 현재 300개 정도의 리드 물질에 대한 결과를 도출 중이다. 이 밖에 영국의 Healx [[129]], 케나다의 Cyclica [[130]], 한국의 Deargen [[131]] 등이 COVID-19를 타겟으로 AI를 이용한 신약발굴 플렛폼으로 소개되고 있는 회사들이다.
현재까지 COVID-19에 대한 치료효과를 검증할 수 있는 방법으로 코로나바이러스와 코로나바이러스에 감염된 세포와의 상관관계에 초점이 맞추어져 있었다. 따라서, in vitro 실험에서 세포에 대한 독성, 그리고 바이러스의 증식 감소 등과 같이 간단한 결과들이 데이터베이스화 되어 머신러닝으로 적용되어 결과를 중심으로 적합한 치료제들이 발굴되는 형태를 띄고 있다. 특히, Baricitinib이 주목을 받는 것은 바이러스 감염기전의 차단과 함께, 바이러스감염에 의하여 사망에 이르게 하는 주요 병증인 사이토카인스톰을 제어할 수 있다는 점이며, 이는 항바이러스 및 항염증의 두 가지 목적을 달성할 수 있다. 다중목적 결과를 도출하기 위한 네트워크 분석의 중요성을 보여주고 있다 [[132]]. 인공지능 플렛폼의 대부분은 심층학습분석 및 symbolic AI 등을 활용한 자체적으로 최적화된 모델을 사용하고 있고, 적용되고 있는 데이터베이스의 양과 질이 높은 수준이 약물 후보군 발굴의 정확도를 높이고 있음을 제시하고 있다.
이 모든 결과들을 종합하여 보았을 때, 이번 COVID-19에서는 인공지능기반 감염병 신약의 개발은 임상현장에서 검증 중이며, 그 무한한 가능성을 확인하기 위한 도마 위에 서 있다. 하지만 최근 가능성이 있다고 보여지는 클로로퀸 등 일부 약물이 효과적인 결과를 보여주지 못하고 있다. 그 원인에 있어, 바이러스의 특성상, 변이가 다양하게 나타난다는 점, 새로운 클론에 대한 인체 감염 기전과 면역회피기전 그리고 병증의 다양한 변화와 같은 변수들이 존재한다는 점에서 머신러닝을 통한 학습과 예측을 어렵게 하고 있다. 이외에도 인체내 복잡한 면역 기전과 바이러스의 면역회피기전, 생물학적인 요소들에 대한 한정적인 정보들 또한 해결해야 하는 부분이다. 미국 MIT-IBM Watson AI lab에서 COVID-19 환자 중 패혈증으로 심각하게 영향을 받을 수 있는 환자에 대한 진단기술이 개발되었다 [[133]]. 이는 특정한 환자에서만 나타나는 과도한 면역반응을 이해할 수 있고, 그리고 이를 효과적으로 차단할 수 있는 약물을 확보한다는 점에서 지금 인공지능으로 개발중인 약물 또한 사람에 따라서 치료효과가 달라질 수 있음을 의미한다. 따라서 이번 환자들 가운데, 완치된 환자와 사망한 환자에 대한 면역반응에 대한 이해와 데이터베이스 확보가 추후 동일한 혹은 비슷한 감염성 바이러스 질환에 대한 열쇠가 될 수 있다.
의료 인공지능에 대한 표준화는 2018년부터 시작되어 2019년 ITU-T/WHO, DICOM 등에서 적극적으로 추진되고 있으며, 영상 의학 분야, 진단 보조 및 임상 의사결정, 신약 개발, 건강관리, 병리 분석 및 질병 예측 등의 영역에서 적극적인 기술과 표준 개발들을 추진 중에 있다 [[64]].
<표5>와 같이 일반적인 의료 인공지능 국제 표준화는 “인공지능 기반 의료기기"를 개발하는 과정에서 위험을 관리하고 필수 성능을 보장하기 위한 일관된 체계를 만드는 것이었다면, 감염병 재난 대응 환경에서의 의료 인공지능 표준화는 감염병 재난 대응 체계의 단계별 방역 활동(유입차단, 현장대응, 확산방지, 치료/신약개발)들을 얼마나 정확하교 효과적으로 지원할 수 있도록 하는가에 촛점을 맞춘다는 점에서 차이를 갖는다.
의료 인공지능 표준화 | 감염병 대응 인공지능 표준화 | |
---|---|---|
표준화 목적 | 의료 활동 지원 | 감염병 방역 활동 지원 |
표준화 대상 | 인공지능 기반 의료기기/의약품 | 방역 지원 시스템 |
표준화 우선 목표 | 안전성, 정확성 | 신속성, 상호운용성 |
주요 표준화 이슈 | 위험관리, 품질관리, 필수성능 평가 | 상호운용성, 데이터 교환, 성능 평가 |
또한 감염병 재난 대응 인공지능 표준화 분야는 의료 행위 지원을 포함하는 포괄적인 감염병 방역 활동 지원을 목적으로 하며, 의료기기인 감염병 자동진단지원 시스템 및 비의료기기 시스템들까지 포괄하는 방역 지원 시스템 전반을 다루며, 신속성과 상호운용성 확보를 우선 목표를 갖는다는 점에서 좀더 광의의 범위라 정의할 수 있다.
이번 장에서는 국제 표준화 기구들에서 진행되고 있는 인공지능 표준화 중 감염병 대응 관련 인공지능 표준화에 대해 살펴본다.
헬스케어 분야의 인공지능 관련 국제 표준 개발을 위해 WHO(세계보건기구, World Health Organization)와 ITU(국제전기통신연합, International Telecommunication Union)가 ITU-T 산하에 FG-AI4H(Focus Group on AI for Health)가 2018년 7월에 신설되어 현재까지 다양한 활동을 진행해 오고 있다 [[65]].
FG-AI4H 그룹은 2018년 9월 25일부터 27일까지 스위스 제네바 WHO 건물에서 첫 워크숍과 회의를 개최한 이후로 현재까지 총 8번의 공개 세미나와 대면 회의를 개최하여 왔다. 2020년에는 코로나 팬더믹의 영향으로 3월 회의를 취소하였고, 5월 회의는 온라인으로 개최하였다.
FG-AI4H는 WHO의 기본 철학처럼 선진국과 후진국을 모두 아우르는 의료 인공지능 분야 표준화 이슈들을 발굴하고 평가 체계를 만들려는 노력을 진행하여 왔다는 점에서 큰 의미를 갖는다고 할 수 있다.
FG-AI4H는 총 6개의 WG을 구성하여 문서 이슈들을 논의하고 있으며, 18개의 TG(Topic Group)로 확장하여 주제별 표준화 이슈 발굴을 위한 노력들도 진행하고 있다 [표6].
FG-AI4H의 주요 산출물 목표와 계획은 [그림10]과 같이 의료 분야에서 인공지능 기술을 활용하는데 필요한 윤리 고려사항, 규제 고려사항, 데이터와 평가 모델 등을 종합적으로 정의하고자 하고 있다.
FG-AI4H활동 중 감염병 대응과 관련된 활동들로는 다음과 같은 사항들이 진행되고 있다.
인공지능 기반의 감염병의 조기 탐지 및 발견 알고리즘 성능 평가를 위한 Topic Group. 독일 RKI(Robert Koch Institute) 에서 제안하여 구성된 TG로 감염병 탐지 알고리즘과 시스템들이 각 국가별로 개발되고 있는 상황에서, 객관적인 성능평가 모델을 만들고 이를 기반으로하는 평가 절차들을 만들고자 하는 것을 목적으로 한다.
또한 이를 위해 필요한 용어 정의, 탐지 알고리즘을 위한 감염병 이벤트에 대한 정의 방법, 성능 평가를 위한 레이블링되지 않은 감염병 케이스의 활용 방법, 벤치마킹에 필요한 메트릭스 유형, 성능 평가용 데이터 구성 방법, 감시 데이터의 종류와 유형 등과 같은 다양한 사항들에 대한 논의를 목적으로 하고 있다.
관련 문서: E-026, E-026-A01, I-018-A01, I-018-A02, I-018-A03
저개발국가 및 개발도상국 국가에서는 의료인의 부족으로 의료 서비스에 대한 접근이 제약되는 상황에서 AI 기반 증상 평가 및 자가 진단을 하는 앱의 활용이 늘어나고 있다. TG-Symptom에서는 AI 기반 증상 평가 및 자가 진단용 응용들에 대한 표준화된 벤치마킹 체계를 만들어 보다 많은 사람들에게 의료 서비스를 이용할 수 있게 하는 것으로 목적으로 한다.
이를 위해 필요한 벤치마킹해야 할 주요 기능(중증도 분류, 다음 단계 조언, 감별 진단, 설명, 질문 흐름 등)의 범위와 종류 정의, 평가를 위한 점수와 메트릭스 체계, 용어와 온톨로지(SNOMED, ICD 등), 벤치마킹 모델, 증상 기반 의사 결정 지원을 위해 고려해야 할 요소들에 대한 논의를 목적으로 하고 있다.
관련 문서: A-020, B-021, C-019, C-025, I-021-A01, I-021-A02
최근 발생한 코로나 바이러스(COVID-19) 팬더믹은 5월13일 현재 213개국으로 확산되어 432만명의 확진자와 30만명의 사망자, 그리고 평균 6.8%에 이르는 높은 치사율을 보여주며 인류에게 큰 위협으로 다가오고 있다.
이런 상황에서 인공지능 등 디지털 기술을 활용한 빠른 대응은 인류 생존을 위한 주요 과제가 되고 있으며, 이번 5월 회의에서 제안된 COVID-19 건강 응급 상황 ad-hoc WG은 전염병 비상 사태의 전주기에서 인공지능을 어떻게 효과적으로 활용하며 대응할 것인가에 대한 관련 정보를 수집/분석/공유하며 협력하는 것을 목적으로 하고 있다.
단기적으로는 COVID-19 대응 사례와 경험 공유 체계를 구축하고 협업, 웨비나, 프로젝트 협력 등을 추진하는 것으로 목표로 하며, 중장기적으로는 전염병 예방 및 준비, 조기발생 대응 등 전염병 비상 사태 전주기에 인공지능과 디지털 기술 활용 프레임워크를 만드는 것으로 목표로 한다.
FG-AI4H에서는 이 밖에도 종합적인 의료 인공지능에 대한 표준화를 추진하고 있으며, 다양한 응용 사례들에 대한 통합적인 벤치마킹 및 성능평가 표준 체계를 만들기 위한 노력들을 진행하고 있어, 지속적인 관심과 대응 노력이 필요하다
의료용 디지털 영상 및 통신(DICOM: Digital Imaging and Communications in Medicine) 표준은 의료용 기기에서 디지털 영상표현과 통신, 저장과 관련된 규격을 정의하고 있다. DICOM 표준은 영상 의학 분야 모든 촬영술에서 생성되는 영상 데이터들을 제조사나 모델과 관계없이 교환할 수 있도록 한다.
최근 의료영상 기반의 CADx(Computer Aided Diagnostic), CDSS(Clinical Decision Support System) 등 의료 인공지능 제품과 서비스가 급속하게 확산되는 상황에서, 일관된 데이터 표시와 시스템 간의 상호호환성 있는 인공지능 기반 진단 업무 흐름 표준화를 위해 DICOM 표준 확장 개발을 추진하고 있다.
DICOM은 2018년 11월, WG 23의 명칭과 활동 범위에 AI를 추가하고, 본격적인 활동을 개시하였다. DICOM WG 23은 IHE(Integrating the Healthcare Enterprise)와 함께 임상 환경에서 표준화된 AI workflow 지원과 AI result 표시를 위한 표준 개발을 진행하고 있다 [[64]].
이기종 의료정보시스템간의 정보 교환을 표준 제정을 위해 설립된 HL7(Health Level 7)에서 좀더 손쉽게 시스템간 인터페이스를 할 수 있도록 웹서비스와 자원 기반으로 하는 RESTful 인터페이스 방식으로 만든 규격이 FHIR(Fast Healthcare Interoperability Resources) 표준이다. COVID-19 팬더믹 상황을 맞이하면서 다양한 HL7/FHIR 신규 프로파일들을 만들기 위한 그룹들이 제안되고 있으며, 관련 오픈소스 프로젝트들도 활발하게 진행되고 있다.
SANER 프로젝트는 COVID-19 감염병 상황을 포함해 미래 공중 보건 환경에서의 의료 자원 현황과 시스템 현황 정보들을 실시간으로 파악하고 대응할 수 있도록 하기 위한 목적으로 추진되고 있다. HL7/FHIR 표준을 기반으로 재난 발생시 의료 시설, 중요 인프라 및 정부 대응 기관간에 자원 정보 교환에 필요한 상호호환성 확보를 목표로 하며, 이를 위한 오픈소스 개발 프로젝트를 함께 추진하고 있다.
COVID-19 상호호환성 프로젝트는 COVID-19 (이전의 '2019 소설 코로나 바이러스') 질환과 SARS-CoV-2 (심한 급성 호흡기 증후군 코로나 바이러스 2) 관련 증상, 선별, 검사실, 인구 통계 및 관련 자료를 HL7/FHIR 기반으로 교환할 수 있도록 상호 운용 가능한 사항들을 정의하는 것을 목표로 한다.
이 프로젝트는 COVID-19 Interoperability Alliance 활동의 일부로 연계하여 진행되고 있다.
이밖에도 다양한 HL7/FHIR 기반의 COVID-19 대응 프로젝트들은 관련 링크를 통해 정보를 확인해볼 수 있다. https://confluence.hl7.org/display/CR/COVID-19+Related+Projects
미국에서는 COVID-19 팬더믹 환경에서의 연방 정부 내의 의료 정보 교환 상호호환성 확보를 위한 표준화를 진행하였다.
중국 정부는 COVID-19 재난 극복을 위해 인공지능과 ICT 기술을 적극 활용하여 전염병 모니터링 및 분석, 바이러스 추적, 예방 및 치료, 자원 할당 등을 잘 할 수 있도록 하는 권고문을 2월에 발표하였다 [[88]]. 이를 시작으로 CAICT(中国信息通信研究院, China Academy of Information and Communications Technology), AIIA(Artificial Intelligence Industry Alliance) 등은 COVID-19 대응을 위한 인공지능 제품 정보 포털을 개설하고, 13개 인공지능 응용 제품 분류(AI 온도측정, AI 진단보조, 지능형 로봇, 지능형 음성 서비스, 순찰 로봇, 게놈 테스트, 의약품 R&D 등)를 중심으로 인공지능 제품 사례들을 모으고, 이를 종합하는 보고서[[39]]도 발간하였다.
이중 시급하게 자국내 표준화가 필요한 “AI 기반의 인체온도측정 시스템에 대한 평가 사양”과 공동 시험 방법을 개발하였고, 기타 추가 표준 개발을 추진하고 있다.
국내에서 감염병 대응을 포함해 의료 인공지능 관련 표준으로 아직 개발되거나 진행 중인 사항은 없으나, 빠르게 진행되고 있는 다양한 국제표준화 활동과 연계한 적극적인 대응 활동이 필요하다.
ETRI에서는 2019년 선제적 차원에서의 의료 인공지능 분야 표준화 항목 발굴과 전략 수립을 위해 관련 국내 전문가들과 함께 “ICT 융합 표준 프레임워크” – 스마트 헬스 분야 개발 작업을 진행하였다. 의료 인공지능 분야 중 인공지능 기반 의료기기와 인공지능 주치의라는 2개 분야에 대해 <표7>과 같이 총 5가지의 유즈 케이스를 도출하고, 관련 표준화 갭 분석 및 전략들을 도출하였다 [[66]].
현재 도출된 표준 프레임워크의 의료 인공지능 주요 유스케이스들은 병증에 특화되지 않은 일반적인 시스템을 기반으로 도출된 사항이므로, 대상 환자 및 대상 병증 등을 감염병으로 특화시켜 적용할 수 있다. 감염병 대응 유즈케이스로 변경하더라도 프레임워크의 표준 갭 분석을 통해 식별된 60여 건 이상의 잠재 표준 개발 요구들을 기반으로 감염병 대응에 필요한 의료 인공지능 시스템 개발 및 이를 위해 필요한 표준 개발 전략 수립에 활용 가능하다.
서비스 패키지 | 단위 서비스 유스케이스 | 감염병 재난시 변경 활용 가능 여부 |
---|---|---|
(SP-01) 인공지능 기반 의료기기 |
|
|
(SP-02) 인공지능 주치의 서비스 |
|
|
단위 서비스명 | 유스케이스 요약 |
---|---|
(SU-01-01)자동 진단 보조 | 의료영상 장비에서 생성된 영상을 이용하여 인공지능 기반의 사전 진단, 치료방법 제안, 예후 예측 등의 진단 보조하는 시스템 |
(SU-02-01)다기관 데이터 기반 CDSS | 다기관에서 얻어진 임상정보를 기반으로 학습하고, 다기관으로부터 얻어진 환자의 임상정보를 종합하여 의료인이 질병을 진단하고 치료할 때 의사결정을 도와주는 시스템 |
(SU-03-01) 자동 음성인식 의료 정보 기록 | 의료진이 구술한 메모 내용, 환자와의 상담, 진료에 쓰이는 의학 및 약학 용어를 자동 음성 인식하여 의료 정보 시스템에 기록/저장하는 시스템 |
(SU-04-02) 인공지능 기반 주치의 서비스 | 인공지능 기술와 무인 이동 진료소을 통하여 환자의 건강 상태 점검에 필요한 기본 검사들을 수행하고, 환자의 건강기록을 기반으로 온라인/오프라인을 연계하는 진단/예측/처방이 가능하도록 하는 서비스 |
(SU-05-02)만성질환 케어 에이전트 | 인공지능 기반 에이전트를 통해 만성질환자 등의 상태를 사용자 친화적 인터페이스로 주기적/정기적/예측적으로 체크하고 건강을 관리할 수 있도록 하는 서비스 |
표준 프레임워크에서는 시나리오별 분석과 갭 분석을 통해 다음과 같은 분석 결과를 포함하고 있으므로, 이를 활용한 표준화 전략 수립이 가능하다.
최근의 감염병 재난 상황에서 가장 많이 요구되는 사항으로 원격 진료를 포함한 비대면 진료에 대한 요구사항이 있다. 이러한 추가적인 사항들에 대해서도 기존 시나리오를 활용하여 추가 분석하는 것이 가능하다. 예를 들어 인공지능 주치의 시스템 사례의 경우, <그림12>와 같이 노란색과 같은 부분이 비대면 진료와 원격진료를 지원하기 위한 요소가 될 수 있다.
자동 진단 보조 시스템의 경우는, <그림13>시나리오 분석에 비대면 지원에 필요한 요소를 파악하고 필요한 추가 요소를 반영하여 추가 분석할 수 있다.
감염병 대응을 위해 인공지능 기술을 활용한 응용과 서비스들은 크게 “의료기기”와 “비의료기기”로 구분할 수 있으며, 의료기기는 필수성능과 위험관리 규제 체계 하에서 엄격하게 관리가 되어야 하고, 이에 필요한 표준들이 개발되고 적용되어야 한다 [[64]]. 반면 비의료기기는 별도의 규제 없이 자유롭게 운용 가능할 수 있으며, 최소한의 성능과 상호호환성 측면의 고려만 필요하다. 그러므로 이런 제약과 특징을 고려한 표준화 전략 수립과 표준 개발 작업이 필요하다.
감염병 대응을 위한 인공지능 기반 의료기기와 관련하여 필수적으로 고려해야 할 표준화 주제들은 <그림14>와 같이 전체 생애주기의 관점 속에서 고려하는 것이 필요하며, “의료 인공지능 10대 표준화 동향 및 전망”에서 도출하였던 10가지 사항들을 중심으로 고찰해볼 수 있다 [[64]].
좀더 체계적인 감염병 대응을 위한 의료 인공지능 기술 표준화 전략 수립을 위해서는 현재의 스마트 헬스 표준 프레임워크에는 반영하지 못했던 추가적인 유즈케이스들에 대한 분석들도 필요하다.
예를들어 다양한 정보들을 통합하는 감염자 역학 추적, 의료 자원 통합 관리, 디지털 병리 분석, 감염병 대응 응급의료 시스템, 진단용 챗봇, 중환자에 대한 조기 알림 및 신속 대응, 중환자실 간호 보조 시스템, 자가격리자 종합 관리, 다기관 데이터 기반 감염병 경보 시스템, 비대면 진료 시스템 등과 같은 다양한 신규 유즈케이스 시나리오 도출과 분석, 그리고 이를 기반으로 한 표준 갭 분석과 표준화 전략 수립이 가능할 것이다.
더불어 표준 프레임워크 분석 작업을 통해 이미 도출되었던 잠재 표준들 중 감염병 대응을 위해 시급하게 표준화가 필요한 요소들을 정리하여 국내/국제 표준화를 추진하는 작업도 필요하다.
ML과 AI는 <부록1>의 단계별 기술 적용 및 응용 사례 표와 같이 감염병 발생의 조기 예측부터 진단 기술 개발, 신약 개발까지 감염병 대응의 전 과정에 걸쳐 활용될 수 있는 가능성을 보였다 [[6]][[7]][[8]][[9]][[10]][[11]][[12]][[13]][[14]][[15]][[16]][[17]][[67]].
이번 보고서에서는 감염병 재난시 4가지 대응 단계별로 적용 가능한 인공지능 응용 범위와 사례들은 <그림15>과 같이 분류하였다. 그리고 감염병 재난 대응을 위한 인공지능 기술은 예측과 예방 단계로부터 치료/간호 지원 기술 연구개발 단계로 이어진 후, 다시 예측과 예방을 위한 기반 기술과 경험으로 활용되는 기술 발전 순환 구조가 만들어질 것으로 보인다.
주요 인공지능 기술들은 다양하게 융합되면서, <그림16>과 같이 주요 감염병 재난 대응을 위한 AI 응용들에 적용되고 활용되고 있다.
감염병 재난 대응 인공지능 기술과 관련해 종합적인 연구 분석이 이루어지기에는 아직 많은 시간이 부족한 상황이라 할 수 있다. 21세기 최대 팬더믹 상황 속에서 시급하게 여러 연구들이 시작되었고, 아직 연구가 진행중인 사항들도 많은 상황이다. 대표적인 동향 분석 사례들은 다음과 같으며, 앞으로도 지속적으로 연구 사례들이 발표되며, 관련 추가 분석들도 지속적으로 이루어질 것으로 예상된다 [[89]].
현재까지의 검토만으로 아직 AI 예측 결과를 완벽하게 신뢰할 수 없거나 의료 현장에서 안심하고 사용할 수 없다는 한계점이 많다는 결론들도 도출되고 있다 [[87]]. UNGP와 세계 보건기구 (WHO), 몬트리얼 대학 등이 공동 발표한 논문에서도 COVID-19 대응을 위한 다양한 AI 응용 연구 결과들을 분석했지만 아주 소수만 “완성도"를 달성하고 있다고 결론을 맺은바 있다 [[68]]. 또다른 연구에서도 AI 시스템이 아직 예비 단계에 있을 뿐이란 평가도 내리고 있다 [[72]]. 현재 공개 데이터 세트에는 AI 알고리즘의 훈련 및 테스트를위한 이미지 수가 매우 제한되어 있으며 데이터 세트의 품질이 충분하지 않다는 점은 주목할 필요가 있고[[70]], 많은 진단 도구들이 중국에서 개발되었고 병원에서 활용되고 있다고는 하지만 객관적으로 검증된 결과가 나오지 않았다며, AI 시스템 완성도 한계에 있다는 지적도 있다 [[73]]
각 감염병 재난 단계별로 주요 AI 응용들에 대한 기술 난이도와 제품화 수준, 시장 가능성과 국내 경쟁력은 <그림17>과 같이 요약해볼 수 있다. 이때 각 지표별 수준은 낮음(1)으로부터 높음(5)의 숫자로 수치화하여 표시하였다.
이러한 분석 프레임워크를 기반으로 나아가 주요 응용별 기술 개발 전략과 향후 발전 방향에 대한 다양한 분석을 해볼 수 있을 것으로 예상된다.
앞으로도 유사한 신종 감염병들이 지속적으로 등장할 것으로 예상되는 상황에서 이러한 한계와 문제점을 극복하면서 AI 기술을 활용하여 감염병 대응을 지원할 수 있도록 하기 위해서는 다음과 같은 사항들을 고려한 연구 개발 추진이 필요하다.
첫째, 데이터의 개방과 활용 정책의 중요성이다. 긴급한 감염병 재난 상황에서 신속 대응에 필요한 인공지능 시스템의 모델링과 학습, 개발을 위해서는 양질의 데이터가 공개되고 자유롭게 활용될 수 있는 체계가 만들어져야 한다. 이를 위해서는 인류가 공동으로 활용할 수 있는 데이터 개방 정책과 글로벌 협력 체계가 필요하다. 더불어 데이터의 부족 문제와 데이터 과잉 문제를 해결할 수 있는 방법들도 함께 고민되고 마련되어야 할 것이다.
둘째, 의료 영상 및 환자 이력을 포함하는 익명화된 임상 데이터를 공유하는 개방형 글로벌 저장소(open global repositories)를 만드는 것이 필요하다. 기관별/지역별/국가별 데이터를 통합하고 활용할 수 있도록 저장소는 설계되어야 할 것이다. 더불어 손쉽게 데이터를 공유 활용할 수 있도록 하기 위해 공유활용을 위한 임상 프로토콜과 데이터 공유 아키텍처 설계가 필요하고, 데이터 거버넌스 프레임워크도 함께 만들어져야 할 것이다.
셋째, 의료 데이터 활용에 대한 규제 요구 사항들과 개인 정보 보호 메커니즘도 반드시 적용되어야 한다. 특히, 임상 응용 분야의 AI는 테스트 데이터 세트에서의 성능뿐만 아니라 실제 임상 워크 플로에 통합 될 때의 효과와 안전성도 입증해야 한다. 나아가 개발된 모든 AI 응용 프로그램은 윤리 원칙을 준수하고 인권 침해의 요소가 없는지 충분한 고려와 평가가 이루어져야 할 것이다.
넷째, 한국은 코로나19 재난 위기 상황 속에서도 다양한 정보통신 기술을 이용한 혁신적인 감염병 재난 대응 사례들을 선보였다 [[91]]. 이러한 사례와 경험들에 인공지능 기술들을 적용할 수 있는 기회들을 보다 많이 만들고, 이런 경험들을 국제적으로 알리면서 동시에 국제 협력할 수 있는 체계를 만드는 것이 필요하다.
넷째, 다양한 국가들의 상황들을 고려한 연구들도 필요하다. 최신 기기와 최고급 기술만이 아닌, 아프리카와 저개발 도상국들의 상황을 고려한 제한된 자원과 기술을 사용하는 적정기술 응용에 대한 고려들도 필요하다.
코로나 바이러스 재난 상황에서 특히 돋보였던 특징 중 하나는 다양한 오픈 데이터셋의 등장이었다. 개인/회사/지역/정부기관까지 다양한 주체들이 적극적으로 나서서 데이터셋을 만들고 공개하였고, 뒤를 이어 그 오픈 데이터셋을 이용한 또다른 오픈 서비스가 등장하는 식의 개방형 순환구조가 만들어졌다.
오픈 데이터 활동은 오래전부터 이루어졌던 사항이지만, 감염병 재난 상황에서 긴급하게 진행되는 오픈 데이터 활동이 더욱 중요한 것은, 미지의 신종 바이러스에 빠르게 공동 대응하기 위해서는 발빠른 데이터와 경험의 공유가 필수적이기 때문이다. 특히 AI 기술을 활용해 새로운 알고리즘과 아키텍처를 개발하고 훈련시키기 위해서는 양질의 데이터 공유가 더더욱 필수적이다. WHO에서도 신속한 데이터 공유는 공중 보건 활동의 기초라는 사실을 강조하며 연구 논문과 함께 온라인 데이터 세트 공유를 권장하였고, 이를 위한 공유 활용 절차도 제안하고 있다 [[74]][[75]].
우선 현재 발생 사례 수와 위치, 지역별/국가별 상황 등에 대한 정보는 COVID-19 전염병의 진행 상황을 추적하고 새로운 감염의 성장률을 계산하며 예방 조치의 영향을 관찰하는 데 필수적인 데이터라 할 수 있다.
존스홉킨스대학을 비롯해 ECDC, MIDAS 등의 다양한 곳에서 전세계 데이터를 통합하는 시도들을 한 사례들도 있었고, 개별 국가별/지역별로 통계 데이터들도 공개되고 취합되고 공유되었다 [[76]]. 이런 자발적 개방 데이터셋은 현황을 더욱 빨리 판단하고, 향후 전망을 빠르게 분석하고 예측하는데 많은 도움을 주고 있다. 그러나 한편으로는 데이터 부족과 노이즈를 포함한 데이터들로 COVID-19의 확산에 대한 AI 예측은 아직 정확하지 않거나 신뢰할 수 없고[[77]], 결국 지금까지 추적 및 예측에 사용되는 대부분의 모델은 AI 방법을 사용하지 않는다는 평가도 있다.
오픈 데이터 활동은 각국 정부의 공공 데이터 개방과 활용을 촉진하는 계기도 되었다. 각국에서 운영하던 공공데이터 포털을 통해 좀더 정확하고 공신력 있는 데이터를 빠르게 갱신하며 제공하는 계기를 만들었다. 프랑스에서는 24개 데이터셋(코로나 관련 병원 데이터, 응급 및 의사 데이터, 선별 진료 관련 데이터, 버스 제공 정보, 쓰레기 수거 일정 등), 미국은 11개 데이터셋을 공공데이터 포털을 통해 제공하였다. 한국도 공공데이터 포털을 통해 공적 마스크 판매 정보, 국가/지역별 안전 소식, 코로나19 관련 병원 정보, 선별진료소 현황 등을 제공하였고, 점차 데이타의 종류도 늘여 나갔다[[78]]. 또한 건강보험심사평가원이 보유하고 있는 청구 데이터를 이용하여 코로나19 임상데이터 를 공개하기도 하였다.
데이터의 가치를 지속적으로 극대화시키기 위해서는 재사용할 수 있도록 제공하는 것이 필요하다. 이를 위해 정부 공공 데이터는 공개 데이터의 8 가지 원칙[[79]]을 고려해야 하고, 공개 데이터 세트의 재사용성을 높일 수 있도록 재사용성을 평가하기 위한 MELODA 5 지표[[80]]에 대한 고려도 필요하다. 아직 현재 전세계적으로 공개되었던 COVID-19 관련 공공 데이터셋을 평가했을 때, 재사용성이 잘 보장되는 데이터셋이 없었다는 분석 결과[[76]]는 향후 공공데이터가 AI에 잘 활용될 수 있도록 하기위해 반드시 짚어봐야 할 점이다.
2020년 3월17일, 미국 알랜 연구소와 백악관 과학기술정책사무국(OSTP), 국립의학도서관(NLM), 주커버거 이니셔티브(CZI), Microsoft, 조지타운 대학의 CSET은 기계 판독 가능 코로나 바이러스 문헌 컬렉션인 CORD-19 공개 데이터셋을 발표하면서 kaggle challenge를 진행하였다. 초기 버전에는 29,000 개이상의 논문, 13,000 개 이상이 전체 텍스트가 포함된 자료를 공개하였다 [[81]].
CORD-19에 대한 반응은 폭발적이었다. 한달만에 데이터넷은 150만회 이상 조회되었고, 7.5만회 이상 다운로드되었다. 그리고 CORD-19 데이터 기반으로 시맨틱 검색이 가능하도록 하는 다양한 도구들도 출시되었다. 아마존과 구글, Microsof, C3.ai 등은 클라우드 기반으로 좀더 효과적으로 데이터를 접근할 수 있는 방법도 제공하였다.
이번 CORD-19 개방형 문헌 데이터셋 공유를 통해 (i) 문헌들 속에서 텍스트를 발견하는 데 가장 적합한 방법, (ii) 파이프 라인에 전문가 큐레이터를 참여시키는 방법 및 (iii) 추출 된 결과를 성공적인 COVID-19 치료와 관리 정책으로 변환시키는 방법 등에 대한 보완이 필요하다는 점도 발견되었고, 나아가 kaggle과 TREK을 통한 다양한 도전 기회들을 만들면서 개방형 데이터를 이용한 개방형 연구, 그리고 개방형 혁신으로 이어지는 것이 어떻게 가능한지도 보여주고 있다.
한국에서도 AI Hub를 통해 포스트코로나 AI챌린지 를 개최하였는데, KT의 해외로밍데이터를 기반으로 하여 해외의 감염병이 국내로 유입될 위험도를 산출하는 모델을 개발하는 것을 목적으로 진행되었다
COVID-19와 같은 글로벌 비상상황에서 오픈 사이언스 정책은 질병 대응 연구 속도를 가속화 시키지만, 아직 데이터 공유 및 협력에서 국경을 초월하는 협력을 통해 데이터 신뢰도, 표준, 호환성, 품질 및 해석기준상이 등과 같은 많은 문제점의 해결이 필요하다. 이를 위해 OECD에서 제안하는 지속적인 오픈사이언스 정책 제고에 대한 권고사항은 참조할만하다 [[82]][[87]].
현재 진단 알고리즘 학습용으로 사용할 수있는 오픈 소스 데이터 세트가 많지는 않지만, 다양한 컨소시엄 들이 구성되고 있기에 향후 지속적으로 늘어날 것으로 예상된다.
현재 공개 데이터 세트에는 AI 알고리즘의 훈련 및 테스트를위한 이미지 수가 매우 제한되어 있으며 데이터 세트의 품질이 충분하지 않다는 점은 주목할 필요가 있다. 향후 신종 감염병 재난 상황에 대비하기 위해서라도 의료 영상 데이터를 체계적으로 개방하고 공유할 수 있는 국제 표준화된 체계와 절차에 대한 고민이 필요하다.
코로나 바이러스 재난 상황을 겪으며 개방형 데이터셋과 관련해 다음과 같은 이슈들이 두드러지게 되었다 [[76]]. 이런 부분들은 앞서 언급했던 이슈들과 함께 해결해야 할 부분이다 [[90]].
코로나 바이러스 재난 상황을 겪으면서 데이터 장벽이 더더욱 큰 걸림돌로 부상하고 있다. 이에 각국이 임상케이스 등을 포함한 질병데이터를 오픈포맷 형태로 공개하고, 기존 의학계뿐만 아니라 첨단 ICT 기업들을 비롯해 일반 대중의 접근성을 더 늘려야 한다는 목소리가 커지고 있다. 향후 인공지능 기반의 감염병 재난 대응을 위해서는 반드시 해결해야 할 이슈다.
의료 인공지능 분야와 감염병 대응 인공지능 기술 분야는 아직 초기 단계로 앞으로도 많은 연구 개발이 필요한 분야이다. <부록1>의 표와 같이 주요 단계별로 적용할 수 있는 다양한 인공지능 기술과 응용 가능성들이 있으며, 앞으로 감염병 재난이 빈번해질수록 인공지능 기술의 필요성과 신규 응용들은 계속 늘어날 것이다.
이를 위해서는 우선 첫번째로, <부록1>의 주요 방역 단계(탐지, 예방, 대응, 회복)별로 예상되는 인공지능 응용 사례들을 살피고, 개별 응용 활성화에 필요한 완성도 부족, 신뢰성 부재, 데이터 호환성 및 재활용성 부재, 학습 데이터 부족 등과 같은 다양한 현황 이슈와 문제점들을 해결하기 위한 국내/국제 표준화 체계를 만들어야 할 것이다.
두번째로 2장의 대표적인 의료 인공지능 사례를 살피며 도출되었던 응용별 이슈들을 좀더 체계화하고 대응 표준화 방안을 수립하는 것이 필요하다.
응용 사례 | 문제점 및 표준화 이슈 |
---|---|
자동 진단 보조 |
|
원격 환자 모니터링 및 예후 예측 |
|
자가 진단 검사 및 음성 인식 |
|
질병과 재난 예측, 감시 |
|
접촉자 모니터링 |
|
신약 개발 |
|
셋째, 국내 ICT 기술을 이용한 K-방역 사례들에 대해 국제 표준화 연계 활동들을 적극적으로 지원하는 것이 필요하다. 3장에서 정리한 것과 같이 현재 ITU-T/WHO의 FG-AI4H 활동, DICOM에서의 의료 인공지능 데이터 교환 표준화, HL7/FHIR의 공중 보건 환경에서의 감염병 대응을 위한 의료정보 상호 교환 프로젝트, 미국의 기본 코드 표준화, 중국의 대응 사례 분석 및 국제 표준화 대응 활동들이 다양하게 벌어지고 있다. 이러한 활동들에 효과적이고 선제적으로 대응할 수 있도록 하는 체계가 필요하다.
넷째, 감염병 대응과 관련한 전략 수립을 위해 표준 프레임워크 추가 작업이 필요하다. ETRI에서 작업한 스마트 헬스 ICT 융합 표준 프레임워크의 내용을 인공지능 기반 감염병 대응 표준화 전략 수립에 적극 활용할 필요가 있으며, 비대면 진료를 비롯하여 미래지향적인 추가 시나리오 발굴과 표준 프레임워크 후속 작업을 하는 것이 필요하다.
마지막으로 다섯째, 감염병 재난 상황에 인류가 인공지능 기술 기반으로 공동 대응하기 위해서는 데이터의 개방과 공유, 활용을 위한 오픈 데이터 활동의 장려, 정부 공공 데이터를 기반으로 하는 오픈 리서치 및 오픈 사이언스의 장려, 그리고 이를 위해 필요한 표준화 체계 수립 활동이 필요하다.
![]() |
|
전종홍 | |
![]() |
|
권인호 | |
![]()
| |
김휘영 | |
![]()
| |
윤주흥 | |
![]()
| |
정규환 | |
![]()
| |
신수용 | |
![]()
| |
표경호 | |
![]()
| |
홍헬렌 | |
![]()
| |
심규원 |