You are on page 1of 8

IDG Summary Automation Anywhere

OCR에 AI 더해 IDP로 진화하다


“성공을 읽는 지능형 문서 처리 구축 전략”

무단 전재 본 PDF 문서는 IDG Korea의 자산으로, 저작권법의 보호를 받습니다.


재배포 금지 IDG Korea의 허락 없이 PDF 문서를 온라인 사이트 등에 무단 게재, 전재하거나 유포할 수 없습니다.
OCR에 AI 더해 IDP로 진화하다
"성공을 읽는 지능형 문서 처리
구축 전략"
김치훈 이사 | 오토메이션애니웨어

RPA와 AI를 결합한 신조어인 RPAI는 그동안 많은 주목을 받아왔다. 그 중에서도 OCR과 AI
기술을 결합한 지능형 문서 처리(Intelligent Document Processing, IDP)는 AI의 활용처를
넓히고, 그 중에서도 특히 AP(Account Payable, 미지급금 처리, 매입 처리), AR(Account
Receivable, 매장 매출 채권 관리) 자동화 영역에서 큰 성과를 냈다.

IDP는 다양한 포맷의 문서를 읽을 때, 기존의 OCR에 더해 NLP, 컴퓨터 비전, 딥 러닝, 머신
러닝 등의 AI 기술을 활용해 정보를 자동으로 추출하고 검증한다. 수동 입력을 자동화해 엔
드 투 엔드 자동화로 대체하고, 꼭 검증과 대조가 필요한 과정에는 쉽고 효율적인 인터페
이스를 제공해 정확도를 높인다.

최근 기업의 디지털 트랜스포메이션 프로젝트는 성공과 실패라는 이분법을 적용하기보다


기술 도입 후 실제 효과, 즉 ROI를 중심으로 평가한다. 전통적으로 ‘돈 쓰는 부서’로 여겨왔
던 IT 역시 자동화를 통해 ‘돈 버는 IT’로 변모해야 한다는 요구 사항이 있다. 오토메이션애
니웨어의 조사 결과에 따르면, 아직도 기업 문서 처리 과정의 75%는 수작업으로 이루어지

성공을 읽는 지능형 문서 처리 구축 전략 │ 1
고 자동화 문서 처리는 단 25%에 그친다. 따라서 OCR 프로젝트에 착수하는 것은 기업 입
장에서 가장 빠르게 수익을 올리는, 즉 ‘돈을 버는’ 길이다.

특히 재무 분야는 매출 채권 관리부터 재무 계획, 분석까지 전 영역에 자동화를 적용하기


쉽다는 특징이 있다. 2020년 페르소나 보고서에서는 대다수 CFO의 재무 분야 혁신에 대
한 개선 의지가 높은 것으로 나타났다. EPL, SRM 등의 기술을 도입하는 기업이 많은 것도
이 때문이다.

IDP의 주요 대상은 B/L(선하증권)과 송장이다. 최근에는 연간 수십만 건의 송장이나

OCR+AI, 인식률의 100만여 페이지의 문서를 IDP로 처리하는 대기업 도입 사례가 늘고 있다. 규모가 크다 보
함정에 빠지지 말 것 니 과제도 있다. OCR의 주 대상이 송장인 것은 해외/국내에서 모두 통일된 문서 양식을 사
용하기 때문이다. 그러나 서술 위주의 문서, 의료비 영수증처럼 학습할 수는 있어도 전국
수만 여 병원에서 사용하는 양식이 각기 달라 처리가 어려운 문서는 OCR로 읽어 내기 어
렵다는 과제가 있다. 이처럼 복잡한 비정형 문서에는 AI를 활용한 IDP의 효율이 높다.

일반적인 AI 프로젝트의 경우 투자 기간도, ROI 일정도 길다는 평가가 있다. AI 관련 기술을


도입해 성공하기가 그만큼 어렵다는 방증이기도 하다. 그러나 IDP처럼 RPA에 AI를 결합해
활용하는 프로젝트의 기간은 통상 90일이다. 이미 5년 전인 2017년에 90일 간의 RPA+AI
프로젝트로 84%의 비용 절감 효과를 볼 수 있다는 벤치마크 결과가 도출된 바 있다. 즉,
IDP 프로젝트의 비용 절감 효과는 사실상 검증이 완료된 것이나 다름없다. 이제 OCR 프로
젝트의 목적은 단순 성공을 전제로 하고, 사람 담당자가 몇 건을 더 처리할 수 있는지, 그 효

2 │ IDG Summary
율에 집중하는 방향으로 이동했다. 담당자 1명이 처리하는 규모를 늘리는 것이다.

보통 IDP 프로젝트에서 가장 집중하는 것은 인식률이다. 그러나 OCR 기능 자체의 인식률


이 높다고 해서 항상 해당 프로세스 단위의 개선이나 생산성·정합성 향상으로 이어지는 것
은 아니라는 점에 유의해야 한다. 판독한 데이터에 대한 최종 정합성 판단이 필요하고, 이
과정을 거친 문서를 대상으로 프로세스 자동화를 구상해야 단위 시간당 생산성을 향상할
수 있다. 따라서 단순 인식률에 매몰되지 말고 프로세스 단위의 생산성에 집중하는 것이
올바른 전략이다.

미국 교직원 보험 및 연금 협회인 TIAA는 각종 영수증과 송장을 자동으로 인식하는 OCR


프로젝트로 큰 효과를 본 조직이다. TIAA는 다양한 업체의 송장을 AA AARI의 IQ봇으로 처
리하는 터치리스 송장 프로세스(Touchless Invoice Process)를 도입했다. 인식률은 100%,
송장의 발급 업체는 550곳 이상이었다. 미국 전역의 TIAA 지부에 각각 영수증과 송장 입
력 및 처리하는 담당자가 있는데, 이 담당자의 업무량은 1인당 연간 467시간을 줄일 수 있
었다.

1인당 연간 467시간이라는 단축 효과는 다양한 가능성을 의미한다. 운영 비용을 줄일 수


도 있고, 직원의 업무 배분을 효율적으로 변경해 다른 더욱 중요한 업무에 투입할 수도 있
으며, 업무의 속도가 빨라졌다고 이해할 수도 있다. TIAA는 터치리스 송장 프로세스를 통
해 3년 간 56%의 ROI 효과를 보았고, 이 기간 동안의 절감 비용은 약 47만 달러에 달했다.
비용 외에도 오류가 줄어들어 처리 주기를 단축했고 재무제표의 정확성을 보증할 수 있었
으며, 적시에 비용을 지급할 수 있어 공급업체와 원만한 관계를 형성할 수 있었다. 또한 단
계별 작업이 자동화되면서 모니터링과 가시성이 개선되는 효과도 얻었다.

글로벌 화학업체 이스트맨(Eastman) 역시 PO 처리 프로세스를 위주로 자동화를 적용해


1년에 4,242시간을 절약했다. 수작업에서 발생하는 오류 역시 100% 감소했다. 오류가
100% 감소했다는 것은 인식률 위주의 함정에 빠지지 않고, 어떻게 하면 사람과 AI가 잘
협업할 수 있는지를 증명했다는 의미다.

솔루션 업체는 성공을 장담하지만, 실패하는 사례도 분명히 있다. IDP 프로젝트의 실패 원

실전에서 IDP 인은 대다수 AI 프로젝트가 실패하는 이유와 사실상 동일하다. 우선 기대가 너무 큰 경우


프로젝트가 실패하는 실패하기 쉽다. 분명 AI는 디지털 트랜스포메이션의 필수 도구지만, AI만으로 모든 진보가
이유 이루어진다고 생각하면 오산이다.

성공을 읽는 지능형 문서 처리 구축 전략 │ 3
보통 OCR 기술에서 가장 중요한 것은 인식률이고 OCR 제
품은 100% 완전한 결과를 보장해야 하며, 100% 성공이 아
니면 실패라고 생각하는 경우가 많다. 그러나 인식률이 높은
OCR을 도입하면 문제가 해결된다는 단순한 기대는 곧 ‘인식
률의 함정’을 불러온다.

인식률은 OCR 기술에서 중요한 요소이고 OCR 제품이 인식


률 제고를 목표로 하는 것은 당연하지만, 인식률에만 매달리
다 보면 프로젝트 전체가 매몰되기 때문이다. OCR 엔진이
만능이 아니라는 것을 뒤늦게 인지한 후 어떻게든 부가적인
솔루션을 도입해 인식률 개선에만 매달리는 경우가 여기에
해당한다. 하지만 기술 투입 비용이 상승하면 프로세스 개선
의 ROI가 낮아지고, 곧 프로젝트를 진행할 당위성이 사라지며 추진 동력을 상실하는 결과
를 낳을 수밖에 없다.

IDP 프로젝트에서는 개별 문자 외에도 문서 형식 판독과 인지도 중요한 기준이 된다.


100가지 문서 종류를 인식할 때 인식률과 인지율을 100%까지 높이는 것에만 집중하다
보면 3개월짜리 IDP 프로젝트가 수십 개월로도 늘어나는 경우가 발생한다. AI 도입 그 자
체에 기대를 건 나머지 당장의 가시적 결과와 단순 수치에만 집착하다 보면 프로젝트의 파
급력이 저하되어 ‘애물단지’로 전락할 위험이 있다.

따라서 AI는 어디까지나 도구이지 목표가 아니라는 점을 명심해야 한다. 기대치를 현실에
맞추고 프로세스 면에서의 ROI 성과를 거두는 전략이 필요하다.

자동화 프로세스 설계의 바탕은 목표 설정과 해당 수행 주체의 실행 범위를 명확하게 하는


것에서부터 출발한다. IDP 같은 AI/ML 프로세스 자동화는 AI/ML 기술 도입을 통해 기존
프로세스를 재설계하는 것을 의미한다. AI/ML, RPA 같은 새로운 기술이 사람이 하던 과정
을 100% 그대로 학습하는 오류도 많다. 그러나 어디까지나 프로젝트 수행 주체의 정확한
전제, 요건, 한계를 인지하고 프로세르를 재설계해야 원하는 결과를 얻을 수 있다.

현업 부서와 IT의 이해에 괴리가 있어도 OCR 프로젝트가 실패하기 쉽다. 현업 부서와 IT는
각각의 책임과 권한이 다르지만, 그럼에도 서로를 이해하고 소통할 수 있는 구조를 먼저
마련해야 한다. OCR 프로젝트의 시작은 대부분 유사하다. 현업 부서에서 아이디어를 제공
하고 IT 부서가 자동화 프로젝트로 발전시킨다.

4 │ IDG Summary
프로젝트 전반에 걸쳐 현업 부서의 피드백을 받고 결과를 보완해 나가야 하므로 현업과 IT
의 매끄럽고 원활한 소통은 필수적이다. 하지만 현업 부서는 아이디어와 작업 문서 등 필
요한 것을 모두 이미 제공했다고 생각하기 때문에 더는 시간을 투자하고 싶어하지 않는다.

OCR 프로젝트는 현업과 IT가 서로 책임을 떠넘기는 것이 아니라, 공동으로 오너십을 가지


고 진행해야 성공할 수 있다. 현업과의 소통 부재는 실사례에서 프로젝트가 실패하고 표류
하는 가장 큰 원인이므로, 모든 AI 프로젝트는 결국 ‘소통’으로 귀결된다고 할 수 있다. 오류
가 발생할 때 함께 원인을 찾고 프로세스를 바꾸거나 봇을 재설계하는 등의 시도를 할 수
있도록, 함께 책임지는 조직 문화를 만들어 나가야 할 것이다.

OCR 프로젝트는 단순한 기성 물품 구입과는 다르다. 좋은 기술을 도입해 업무 과정을 개


선하는 장기 전략이므로 회사 전체의 문화를 바꾸기 위한 사내 모든 조직의 자발적인 협조
가 필요하다.

너무 높은 기대치, 잘못된 프로젝트 설계, 현업 부서와 IT의 불통이라는 3가지 실패 원인을


IQ봇과 AARI가 만드는 보완할 수 있는 마지막 ‘퍼즐 조각’은 IDP에 적합한 솔루션이다. 가장 대표적인 솔루션으
‘성공 방정식’ 로 오토메이션애니웨어의 통합 RPA 인터페이스 AARI의 지능형 자동화 솔루션인 IQ봇(IQ
Bot)을 들 수 있다. IQ봇은 매입과 매출 프로세스를 주로 담당한다. 사전 교육된 AI 모델이
있어 사용자가 쉽게 추가 학습을 할 수 있고, 이를 통해 빠른 시일 내에 목표한 ROI를 달성
할 수 있다. RPA와 단일화된 플랫폼으로 구성되어 모든 문서 유형을 가장 단순한 구성으로
처리할 수 있다. SaaS 형식으로 RPA와 함께 지원되는 엔터프라이즈급 클라우드 서비스라
는 점도 IQ봇의 특징이다.

성공을 읽는 지능형 문서 처리 구축 전략 │ 5
IQ봇을 활용해 송장 프로세스를 자동화하는 방법도 간단하다. RPA 봇은 이메일에서 자동
으로 송장을 다운로드해 IQ봇으로 보낸다. IQ봇은 송장을 300DPI로 전처리한 후, NLP로
데이터를 분류한다. 문서 크기를 조정하거나 필요 없는 필드를 잘라내는 과정도 쉽다. 이후
IQ봇은 다중 페이지 문서를 각기 다른 페이지로 분류해 분리한다.

읽어야 할 문서에서 IQ봇이 학습한 데이터로 각 필드 값 항목을 추출한다. 각 필드 값 항목


을 추출한 후 나머지는 사용자가 지도 학습을 한다. 볼륨이 가장 큰 것부터 자동 추출 결과
를 반영한 후 사용자가 학습을 진행하는 것이다. 지도 학습으로 사전 훈련된 AI 모델이 자동
으로 데이터를 추출하고, 부정확한 데이터를 전송해 담당자의 최종 확인과 전송을 거친다.

제외된 문서는 수동으로 내용의 정확성을 확인하고 오류를 검증하는 과정을 거쳐야 하는
데, 현업 부서의 조력이 필요한 이 과정을 실패로 오인하기 쉽다. IT와의 소통이 필요한 이
유도 여기에 있다. 검증 과정에서는 사람이 확인하고 수정할 부분을 확인할 수 있다. 인식
하지 못한 문자, 잘못 인식한 문자, 문서가 구겨진 경우 인식하지 못했다고 판단한 결과 등
이다. 이 결과는 사람이 검증한 후 구조화된 데이터로 변환되어 ERP나 그룹웨어에 업로드
된다.

이 때 검증 권한이 사용자에게 있다는 것은 큰 강점이다. 사람이 쉽게 데이터를 대조해 확


인할 수 있는 단계가 전혀 없어서 실패하는 OCR 프로젝트가 많기 때문이다. 다른 보완 기
술을 새로 도입하는 것보다 AI 엔진이 1차로 확인한 값을 현업 부서가 직접 확인/검증하는
것이 훨씬 경제적인 선택이기도 하다. IQ봇을 사용하는 기업은 OCR 엔진을 자유롭게 바꿀

6 │ IDG Summary
수 있고, IQ봇 내에 분류 엔진을 보유하고 있어 추출 결과의 품질을 극대화한다. 결과적으
로 사람이 수동으로 처리하는 송장을 최소화할 수 있다.

이 때 마지막 결과 확인을 현업이 담당하고, 대신 현업에게 KPI 형태의 성과 지표를 주어서


처리된 결과를 확인하는 것도 업무 담당자의 오너십을 독려하는 좋은 방법이다.

오토메이션애니웨어 IQ봇을 도입한 해외 기업 사례에서는 계정 항목의 80%를 추출한 후


바로 프로덕션 단계에 진입한다. 대신 이 과정은 완료된 것이 아니다. 3개월, 6개월 단위로
학습 구간을 지정하고 연 단위 학습 곡선을 계획하는 것까지 현업의 KPI에 포함해 학습을
장려하는 전략으로 큰 효과를 보고 있다.

또 하나의 강점은 오픈 IQ봇 포털이다. OCR 포털 접근 권한을 받은 후 사용자는 원본 문서


가장 빠르게 성과를 와 읽어 들인 값을 손쉽게 대조할 수 있다. 데이터를 잘못 읽어 들였을 경우 사람이 원본 문
내는 혁신 도구, IDP 서를 보고 확인과 수정을 거치고 저장 버튼을 누르면, 이 형식의 문서는 잘못 타이핑하지
않는 이상 100% 완전하게 처리되는 문서로 분류된다.

과거 현업에서 프로젝트를 진행할 때에는 엑셀 파일이나 맞춤형 RPA 포털 사이트를 만들


어 문서를 확인하는 인터페이스를 별도로 구축해야 했다. 그러나 오토메이션애니웨어의
RPA 인터페이스 AARI와 IQ봇은 이 과정을 매끄럽게 대체하는 하나의 통합된 인터페이스
를 제공한다. 따라서 문서 밸리데이션과 수정 과정 역시 AARI로 손쉽게 진행할 수 있다. 사
용자는 밸리데이션할 데이터를 웹 화면에서 직접 확인하면서 송장 프로세스를 선택하고,
경로와 작업 종류, 회사 코드 등을 정한다. 이후에는 IQ봇이 계속 지정된 폴더 내 문서를 자
동으로 인식하고 필드 값을 읽는다.

디지털 기술로 모든 인력을 대체할 수는 없다. 재무 분야의 효율 개선 작업에는 결국 디지


털 역량과 인력 투입이라는 공통의 요소가 함께 작용한다. 유한할 수밖에 없는 기업의 자
원과 인력을 자동화 기술이 보완하고, 디지털 트랜스포메이션 전략의 일부로써 매입 매출
프로세스가 더욱 투명하고 빠르게 처리될 수 있다면, ROI 확보는 물론 기업 재무 신인도
및 효율성까지 크게 개선할 수 있을 것이다.

오토메이션애니웨어의 IQ봇을 활용한 프로젝트의 프로세스 단축 효과와


머신러닝 지도학습 프로세스의 시연 영상 바로가기

성공을 읽는 지능형 문서 처리 구축 전략 │ 7

You might also like