You are on page 1of 14

Ⅰ.

보건의료 빅데이터 동향

보건의료 분야에서의 인공지능과


기계학습 활용 및 전망
윤덕용 교수
아주대학교 의료정보학과

1. 들어가는 글
●● 딥러닝(Deep learning)을 필두로 하는 인공지능이 영상 분석, 음성인식 등 다양한 분야에서
우수한 성과를 보이며, 보건의료 분야에서도 인공지능에 대한 기대감이 높아짐

●● 실제로 의학 논문 검색 엔진인 PubMed1) 에서 인공지능 관련 키워드로 검색되는 논문들은 그림 1과


같이 증가하고 있음

7000

6000

5000
The number of publications

4000

3000

2000

1000

0
1950 1960 1970 1980 1990 2000 2010 2020
Deep learing Machine learing Artificial learing

[그림 1] 연도별 인공지능 관련 키워드를 가진 논문의 수(~2018년)

●● 특히 알파고 등장 시점인 2015년을 기점으로 딥러닝 관련 논문들이 급속하게 늘어나고 있음

6
HIRA 빅데이터 브리프

●● 하지만 인공지능을 공부하는데 있어서의 높은 학습 장벽 때문에 아직 보건의료 분야의 많은


연구자들은 인공지능에 대해 막연한 기대감만을 갖고 있는 경우가 많음

●● 따라서, 본 고에서는 인공지능, 기계학습, 딥러닝에 대한 기본적인 개념을 간단히 설명하고, 보건
의료 분야에서 활용된 사례와 향후 전망에 대해 살펴보고자 함

2. 인공지능과 기계학습

[그림 2] 인공지능, 기계학습, 딥러닝 간의 관계 도식도

2.1 인공지능
●● 딥러닝이 인공지능 분야의 대표적인 알고리즘으로 자리잡으면서, 딥러닝이 곧 인공지능으로
표현되는 경우가 많으나, 인공지능은 훨씬 광범위한 개념임
▶▶ 전통적인 정의에 따르면 인간의 지능을 흉내내는 모든 프로그램을 인공지능이라고 할 수 있음2)

●● 현재 과학 기술로는 실제 지능의 원리에 대해서도 자세하게 밝히지 못하고 있기 때문에, 이를


인공적으로 만든다는 것은 불가능함

7
Ⅰ. 보건의료 빅데이터 동향

▶▶ 따라서 지능의 원리는 따지지 않고 프로그램의 결과가 인간의 지능과 유사한 결과를 보인다면
인공지능이라고 할 수 있어, 의사결정나무, Support vector machine, 인공 신경망 등 다양한
알고리즘이 존재함

▶▶ 예를 들어, 어떤 전문가의 경험을 바탕으로 작성된 단순한 순서도(flowchart) 기반의 프로그램도
입력에 대한 결과 반응이 인간의 반응과 유사하다면 인공지능이 될 수 있음

2.2 기계학습
●● 기계학습(machine learning, ML)은 인공지능의 여러 분야 중 한 분야에 속함(그림 2)
▶▶ 기계학습은 다양한 방법을 이용해서 데이터에 존재하는 어떤 패턴을 찾아가는 특징이 있어 ‘학습’
이라는 단어가 붙음

●● 기계학습은 비지도학습(unsupervised learning), 지도학습(supervised learning), 강화학습


(reinforcement learning)으로 분류됨
▶▶ 비지도학습 : 학습하는 데이터에 특정 그룹에 대한 정보(label) 없이 데이터 내에 존재하는
패턴을 찾는 방법으로, 그림 3의 좌측 데이터를 x, y축의 값을 기반으로 하여 우측과 같이 두
그룹으로 나눌 수 있음

[그림 3] 비지도학습 결과 예시

8
HIRA 빅데이터 브리프

▶▶ 지도학습 : 지도학습은 학습하는 데이터에 특정 그룹에 대한 정보(label)가 있어 주어진 정보에


맞춰 패턴을 찾는 방법으로, 그룹에 대한 정보를 바탕으로 그림 3과 동일한 데이터를 분석한다면
결과는 그림 4와 같이 달라짐(화살표)

[그림 4] 지도학습 결과 예시

▶▶ 강화학습 : 강화학습은 시행착오를 겪으며 가장 높은 보상을 받는 행동의 정책을 학습하는 분야로,


그림 5에서 오른쪽으로 가능 행동은 +10점의 보상, 왼쪽으로 가는 행동은 -10점의 패널티를
준다면 여러 번의 시행착오를 겪은 후, 오른쪽으로 가는 행동이 좋다는 것을 학습하게 됨

정책수립
경험(행동, 보상)
→ 오른쪽 선택

강화 학습

-10 +10

[그림 5] 강화학습 결과 예시

▶▶ 딥러닝 : 딥러닝은 패턴을 학습하는 방법, 즉 알고리즘에 대한 이름으로 그림 2에서 제시된


바와 같이 비지도 학습, 지도 학습, 강화 학습에 모두 사용될 수 있음. 인공 신경망 알고리즘을
여러 겹(깊게) 붙여 사용하여 딥러닝이라고 불리움

9
Ⅰ. 보건의료 빅데이터 동향

3. 인공지능과 데이터
●● 앞서 살펴본 바와 같이, 인공지능의 개념은 매우 광범위하지만 현재 가장 주목받고 있는 분야는
데이터에 기반한 방법인 기계학습이며, 그 중에서도 딥러닝이 비지도, 지도, 강화학습 분야에서
가장 활발하게 사용되고 있음
▶▶ 기계학습 알고리즘은 데이터로부터 패턴을 학습하여 데이터가 많을수록 좋은 성능을 보이며,
특히 딥러닝 기반 모델의 경우 모델의 복잡성이 높아 더 많은 데이터가 필요함

Deep learning
Performance

Most other
algorithms

Amount of Data

[그림 6] 데이터와 기계학습 알고리즘의 성능 간의 관계

●● 대부분의 산업 분야에서 정보화가 이루어지고, 데이터 저장에 필요한 비용이 급격하게 감소하면서
가용 데이터의 양이 급속하게 증가함
▶▶ 2010년대 초반, 전 세계의 데이터 양은 5zettabytes 미만이었지만 2018년도에는 33zettabytes,
2025년도에는 175zettabytes에 이를 것으로 예상되고 있음3)

●● 데이터의 양이 급속하게 증가하면서 특히 많은 데이터가 요구되는 딥러닝의 성능이 월등하게


좋아짐에 따라 딥러닝에 대한 기대가 커짐
▶▶ 하지만 한 사람이 생산하는 수많은 정보 중 병원에서는 아주 일부만이 수집되고 있어, 보건의료
분야에서 충분한 데이터가 수집되고 있는지 고민이 필요함

10
HIRA 빅데이터 브리프

Data not recorded

Data recorded outside the hospital

Data recorded in the hospital

[그림 7] 한 사람으로부터 수집 가능한 데이터 중 수집 여부에 따른 분포

●● 아주대학교 병원에서는 이러한 문제를 해결하기 위해 병원에서 수집이 가능한 데이터이지만,


놓치고 있는 데이터들을 최대한 자동적으로 수집할 수 있는 인프라 확충에 노력하고 있음
▶▶ 대표적인 예로 중환자실 및 수술실에서 측정되는 생체신호(심전도, 연속측정 동맥혈압, 호흡
등)를 파형데이터 원본 그대로 실시간으로 수집하는 인프라를 구축하여 운영 중

[그림 8] 아주대학교병원 생체신호 데이터 수집 인프라 구축 현황

11
Ⅰ. 보건의료 빅데이터 동향

[그림 9] 생체신호 데이터 수집 인프라 구축을 위한 작업 현장 사진

▶▶ 2019년 3월 현재 기준, 약 11,000여명의 환자로부터 생체신호 데이터를 수집하였으며,


수집된 모든 파형데이터의 총 길이는 약 650년에 달함

12
HIRA 빅데이터 브리프

4. 보건의료 분야에서의 활용 사례

4.1 비지도학습 : 의학용어 유사도 계산 사례


●● 의학용어들간의 유사도를 계산하기 위해서는 개별 용어들을 계산 가능하도록 수치화하는 과정이
필요한데, 이를 위해 의학용어들의 사용 패턴을 학습하게 하면 각 개념들을 수치화하여 표현할
수 있음

[그림 10] Med2Vec을 이용한 의학용어의 수치화 예시

▶▶ 각 의학용어들은 사용된 기록만 있고, 어떠한 개념인지에 대한 label은 사용되지 않았으며,


단순히 전자의무기록 내에서 사용된 패턴만을 보고 학습하였기 때문에 비지도학습에 해당됨

▶▶ 이렇게 수치화된 개념들은 유사한 의학용어를 추천해 주거나, 유사한 환자들을 찾는데 활용될
수 있음

13
Ⅰ. 보건의료 빅데이터 동향

●● 그림 11은 임상시험 대상자를 찾는 프로그램에 응용된 사례로 특정 약물을 검색하면 비슷한
사용 패턴을 보였던 약물들을, 일부 환자군을 선택하면 유사한 환자군들을 추천해줌으로써
분석과정을 지원함

[그림 11] Metformin과 유사한 사용 패턴을 보이는 약물을 추천해주는 화면

●● 이렇게 비지도학습을 통해 추출된 패턴은 원본의 고차원 데이터에서 의미 있는 인자들이 추출된


(추상화된) 결과이기 때문에, 지도학습이나 강화학습의 입력 데이터로 유용하게 사용될 수 있음

4.2 지도학습 : 중환자실 내 패혈증 발생 예측 모델 개발 사례


●● 본 연구진은 패혈증이 발생한 환자군에서 패혈증이 발생하기 1시간 전의 생체신호 데이터와
패혈증이 발생하지 않은 환자의 생체신호 데이터를 분석하여, 패혈증을 조기에 예측할 수 있는
모델을 개발하였음

[그림 12] 패혈증 예측 모델 개발 연구 모식도

14
HIRA 빅데이터 브리프

▶▶ 예측 모델의 구조는 그림 13과 같이 심전도(ECG), 맥박 파형(PPG), 호흡 파형(RESPIMP)


데이터를 분석한 후, 패혈증 발생에 대한 예측 여부를 결과로 내도록 되어 있음

[그림 13] 패혈증 예측 모델 구조

▶▶ 실제 임상데이터에 적용ㆍ평가하여 현재 약 85%의 정확도를 확보하였으며, 그림 14과 같이


시간별로 특정 환자의 패혈증 발생 위험도를 계산할 수 있음

[그림 14] 패혈증 발생 예측 모델 기반 패혈증 위험도 분석 결과 예시

15
Ⅰ. 보건의료 빅데이터 동향

4.3 강화학습 : 패
 혈증 환자에 대한 승압제 및 수액 치료 전략
수립 사례
●● 최근 Nature medicine지에 발표된 논문에 따르면, 중환자실에서 치료했던 데이터를 기반으로
가상의 임상 환경을 마련해 두고, 그 안에서 시행착오를 경험하며 적절한 승압제와 수액치료를 할
수 있도록 인공지능 모델을 학습시킴5)

[그림 15] Nature medicine지에 소개된 AI clinician 논문


(https://www.nature.com/articles/s41591-018-0213-5)

▶▶ 그 결과, 실제 의료진의 치료 정책보다 인공지능의 치료 정책이 더 많은 환자를 살릴 수 있을


것이라고 평가됨

16
HIRA 빅데이터 브리프

5. 미래 전망
●● 앞서 살펴본 내용들을 바탕으로 보건의료 분야의 빅데이터에서 인공지능 및 기계학습이 적용되는
과정을 보면 그림 16과 같음

[그림 16] 보건의료 빅데이터 기반 인공지능 적용 프로세스 개요

▶▶ 보건의료 분야에서 기계학습의 적용을 위해서는 의료현장에서 의미 있는 데이터를 정확히,


많이 수집하려는 노력이 필요함

▶▶ 이렇게 수집된 원본 데이터는 매우 고차원이며 복잡하기 때문에 중요한 특징을 추출하는


과정이 필요함(비지도학습)

▶▶ 이후 질병의 여부 등을 판단하거나 예측모델의 개발을 위해서 질병에 대한 정보가 포함된


데이터 학습이 필요함(지도학습)

▶▶ 또한 다양한 임상 상황에 맞는 최적의 치료 전략을 수립하는 일도 중요함(강화학습)

17
Ⅰ. 보건의료 빅데이터 동향

●● 현재 앞서 나열한 프로세스의 각 부분들 혹은 몇몇 부분들이 연계된 형태의 연구들이 활발하게


진행되고 있음
▶▶ 각 부분의 연구들에서 우수한 연구 성과들이 도출되고 있어, 향후 가까운 미래에서는 모든
프로세스가 연계되어 궁극적인 AI clinician이 등장할 수 있을 것으로 기대됨

●● AI clinician은 다음과 같은 점에서 인간보다 우수한 능력을 보여줄 것으로 예상됨
▶▶ 환자로부터 필요한 데이터를 보다 효율적으로 수집함

▶▶ 환자로부터 수집한 데이터를 보다 적절하게 추상화함

▶▶ 정확한 진단을 먼저 내릴 수 있음

▶▶ 효과적인 치료 전략을 수립할 수 있음

▶▶ 데이터 및 문헌을 참고하여 새로운 지식을 보다 빠르게 습득

●● 따라서 보건의료 분야에서 활용될 인공지능 기술에 대한 관심을 넘어, 향후 개발될 AI clinician
과의 공존 방향에 대해서도 고민이 필요함

18
HIRA 빅데이터 브리프

참고문헌

1. PubMed. https://www.ncbi.nlm.nih.gov/pubmed/.

2. Russell SJN, Peter. Artificial Intelligence : A Modern Approach 


(3rd ed. : Upper Saddle River, New Jersey : Prentice Hall; 2009.

3. Rydning DRJGJ. The Digitization of the World From Edge to Core. 2018.

4. Sun ECMTBESCCJ. Multi-layer Representation Learning for Medical Concepts.


CoRR. 2016.

5. Komorowski M, Celi LA, Badawi O, Gordon AC, Faisal AA. The Artificial
Intelligence Clinician learns optimal treatment strategies for sepsis in intensive
care. Nat Med. 2018;24(11) : 1716-1720.

19

You might also like