Professional Documents
Culture Documents
챗GPT와 의료의 미래
챗GPT와 의료의 미래
최 윤섭 1*
1
디지털헬스케어파트너스 대표
*Corresponding Author
MAIN
전세계적으로 인공지능 챗 GPT 의 열풍이 뜨겁다. 미국의 오픈 AI 가 내어놓은
챗 GPT 는 거대언어모델(LLM), GPT 에 기반한 인공지능으로, 사람과
대화하듯이 인공지능과 채팅 형식으로 말을 주고 받으며, 다양한 과업을
수행할 수 있다. 과거 인공지능은 딱 한가지의 과업을 수행하는 목적으로
개발되었으나, 챗 GPT 는 일반적인 인지 능력을 가지고 있기 때문에 ‘언어’로
주문할 수 있는 다양한 질문, 명령 등에 대해서 답을 내어놓는다.
그런가 하면, 온라인 포럼에 올라온 환자의 임상적인 질문에 대해서 ChatGPT
가 의사에 비해서 더 양질의 공감력 높은 답변을 해준다는 보고를 한 연구도
있다 [7]. 이 연구에서는 미국의 레딧이라는 온라인 포럼에 올라온 환자의
질문과 의사의 답변 195 개를 무작위로 추출하여 ChatGPT 의 답변과
비교하였다. 답변은 맹검 처리하여 세 명의 의사가 평가하였다.
그 결과 평가자들은 ChatGPT 의 답변을 의사의 답변보다 유의미하게 더
좋다고 평가했다. 총 585 번의 평가 중에 78.6%는 ChatGPT 의 답변이 더
낫다고 평가했다. 또한 ChatGPT 의 답변의 질이 의사의 답변보다 유의미하게
더 높다고 평가했다. ChatGPT 의 답변의 평점은 4.13 점이었고, 의사의 답변은
평균 3.26 점이었다. 또한 좋음/아주 좋음의 평가을 받은 비율은 ChatGPT 는
78.5%, 의사는 22.1%로 3.6 배 정도의 차이가 났다. 뿐만 아니라, ChatGPT 의
답변은 의사의 답변에 비해 유의미하게 환자의 질문에 더 공감을 잘 하는
것으로 나타났다. ChatGPT 답변의 공감은 평점 3.65 점, 의사의 답변은 2.15
점으로 의사의 답변이 41% 낮았다. 공감력이 좋음/아주 좋음의 평가를 받은
비율은 ChatGPT 가 45.1%인데 비해서, 의사는 4.6%로 9.8 배 차이가 났다.
Editorial Comment
디지털헬스케어 전문가인 저자가 집필한 본 원고는 인공지능, 특히
거대언어모델과 같은 첨단 기술이 의료 분야에서 어떻게 활용될 수 있는지에
관한 중요한 통찰을 제공한다. ChatGPT 와 같은 시스템이 의료기기로
분류되어 FDA 를 포함한 전 세계 규제 기관들의 규제를 받게 되는 것은 이
기술이 의료 분야에서 중요한 역할을 할 수 있음을 인정하는 것이라고 생각해
볼 수 있다.
저자는 인공지능이 향후 의사와 환자 모두에게 줄 수 있는 이익의 잠재력을
강조하고 있다. 이러한 기술의 발전은 진단과 치료 계획 수립, 환자 교육 및
관리 등 여러 방면에서 의료 서비스의 질을 향상시킬 수 있다. 그러나
인공지능의 정확성과 안전성을 어떻게 검증할 것인지는 아직 해결해야 할
중요한 문제이다. 거대언어모델 인공지능의 복잡성과 다양성 때문에 이러한
시스템의 결과를 완벽하게 예측하고 통제하는 것은 매우 어렵다. 그러므로
이러한 인공지능 시스템을 안전하고 효과적으로 관리하기 위한 새로운 규제
프레임웍의 개발이 중요하고 이는 기술적인 측면과 윤리적, 법적 측면을 모두
포괄해야 하며, 이를 통해 인공지능기술이 의료 영역에서 환자의 안전을
해치지 않고 그 잠재력을 최대한 발휘할 수 있도록 해야 한다. 이 점이 우리가
인공지능에 지속적인 관심을 가져야하는 결정적인 이유라고 할 수 있다.
결론적으로, 인공지능 등 기술의 발전은 미래 의료에 혁신적인 변화를 가져올
수 있는 막대한 잠재력을 갖고 있지만, 이러한 변화를 안전하고 책임있게
관리하는 것이 가장 중요하다고 할 수있다. 정부기관, 개발자, 의료진이
협력하여 인공지능의 이점을 최대화하고 잠재적인 문제점들을 현명하게
해결함으로써, 의료의 미래를 밝게 열어갈 수 있기를 기대하며, 이에 대한
우리의 지속적인 관심이 필요하다.
References
1
Lee P et al., Benefits, Limits, and Risks of GPT-4 as an AI Chatbot for Medicine, NEJM,
2023 10.1056/NEJMsr221418436988602
2
Bubeck S et al., Sparks of Artificial General Intelligence: Early experiments with GPT-
4, arxiv, 2023
3
Kung TH et al., Performance of ChatGPT on USMLE: Potential for AI-assisted medical
education using large language models, PLOS Digit Health, 2023 10.1101/2022.12.19.22283643
4
Singhal K et al., Large language models encode clinical knowledge, Nature, 2023
5
Singhal K et al., Towards Expert-Level Medical Question Answering with Large
Language Models, 2023
6
Kanjee Z et al., Accuracy of a Generative Artificial Intelligence Model in a Complex
Diagnostic Challenge, JAMA, 2023 10.1001/jama.2023.828837318797PMC10273128
7
Ayers JW et al., Comparing Physician and Artificial Intelligence Chatbot Responses to
Patient Questions Posted to a Public Social Media Forum, JAMA Intern Med.,
2023 10.1001/jamainternmed.2023.183837115527
8
Adams LC et al., Leveraging GPT-4 for Post Hoc Transformation of Free-text
Radiology Reports into Structured Reporting: A Multilingual Feasibility Study,
Radiology, 2023 10.1148/radiol.23072537014240
9
Gilbert S et al., Large language model AI chatbots require approval as medical
devices, Nat Med, 2023 10.1038/s41591-023-02412-6