Professional Documents
Culture Documents
5704 AA TechSummary IDP 20220628
5704 AA TechSummary IDP 20220628
RPA와 AI를 결합한 신조어인 RPAI는 그동안 많은 주목을 받아왔다. 그 중에서도 OCR과 AI
기술을 결합한 지능형 문서 처리(Intelligent Document Processing, IDP)는 AI의 활용처를
넓히고, 그 중에서도 특히 AP(Account Payable, 미지급금 처리, 매입 처리), AR(Account
Receivable, 매장 매출 채권 관리) 자동화 영역에서 큰 성과를 냈다.
IDP는 다양한 포맷의 문서를 읽을 때, 기존의 OCR에 더해 NLP, 컴퓨터 비전, 딥 러닝, 머신
러닝 등의 AI 기술을 활용해 정보를 자동으로 추출하고 검증한다. 수동 입력을 자동화해 엔
드 투 엔드 자동화로 대체하고, 꼭 검증과 대조가 필요한 과정에는 쉽고 효율적인 인터페
이스를 제공해 정확도를 높인다.
성공을 읽는 지능형 문서 처리 구축 전략 │ 1
고 자동화 문서 처리는 단 25%에 그친다. 따라서 OCR 프로젝트에 착수하는 것은 기업 입
장에서 가장 빠르게 수익을 올리는, 즉 ‘돈을 버는’ 길이다.
OCR+AI, 인식률의 100만여 페이지의 문서를 IDP로 처리하는 대기업 도입 사례가 늘고 있다. 규모가 크다 보
함정에 빠지지 말 것 니 과제도 있다. OCR의 주 대상이 송장인 것은 해외/국내에서 모두 통일된 문서 양식을 사
용하기 때문이다. 그러나 서술 위주의 문서, 의료비 영수증처럼 학습할 수는 있어도 전국
수만 여 병원에서 사용하는 양식이 각기 달라 처리가 어려운 문서는 OCR로 읽어 내기 어
렵다는 과제가 있다. 이처럼 복잡한 비정형 문서에는 AI를 활용한 IDP의 효율이 높다.
2 │ IDG Summary
율에 집중하는 방향으로 이동했다. 담당자 1명이 처리하는 규모를 늘리는 것이다.
솔루션 업체는 성공을 장담하지만, 실패하는 사례도 분명히 있다. IDP 프로젝트의 실패 원
성공을 읽는 지능형 문서 처리 구축 전략 │ 3
보통 OCR 기술에서 가장 중요한 것은 인식률이고 OCR 제
품은 100% 완전한 결과를 보장해야 하며, 100% 성공이 아
니면 실패라고 생각하는 경우가 많다. 그러나 인식률이 높은
OCR을 도입하면 문제가 해결된다는 단순한 기대는 곧 ‘인식
률의 함정’을 불러온다.
따라서 AI는 어디까지나 도구이지 목표가 아니라는 점을 명심해야 한다. 기대치를 현실에
맞추고 프로세스 면에서의 ROI 성과를 거두는 전략이 필요하다.
현업 부서와 IT의 이해에 괴리가 있어도 OCR 프로젝트가 실패하기 쉽다. 현업 부서와 IT는
각각의 책임과 권한이 다르지만, 그럼에도 서로를 이해하고 소통할 수 있는 구조를 먼저
마련해야 한다. OCR 프로젝트의 시작은 대부분 유사하다. 현업 부서에서 아이디어를 제공
하고 IT 부서가 자동화 프로젝트로 발전시킨다.
4 │ IDG Summary
프로젝트 전반에 걸쳐 현업 부서의 피드백을 받고 결과를 보완해 나가야 하므로 현업과 IT
의 매끄럽고 원활한 소통은 필수적이다. 하지만 현업 부서는 아이디어와 작업 문서 등 필
요한 것을 모두 이미 제공했다고 생각하기 때문에 더는 시간을 투자하고 싶어하지 않는다.
성공을 읽는 지능형 문서 처리 구축 전략 │ 5
IQ봇을 활용해 송장 프로세스를 자동화하는 방법도 간단하다. RPA 봇은 이메일에서 자동
으로 송장을 다운로드해 IQ봇으로 보낸다. IQ봇은 송장을 300DPI로 전처리한 후, NLP로
데이터를 분류한다. 문서 크기를 조정하거나 필요 없는 필드를 잘라내는 과정도 쉽다. 이후
IQ봇은 다중 페이지 문서를 각기 다른 페이지로 분류해 분리한다.
제외된 문서는 수동으로 내용의 정확성을 확인하고 오류를 검증하는 과정을 거쳐야 하는
데, 현업 부서의 조력이 필요한 이 과정을 실패로 오인하기 쉽다. IT와의 소통이 필요한 이
유도 여기에 있다. 검증 과정에서는 사람이 확인하고 수정할 부분을 확인할 수 있다. 인식
하지 못한 문자, 잘못 인식한 문자, 문서가 구겨진 경우 인식하지 못했다고 판단한 결과 등
이다. 이 결과는 사람이 검증한 후 구조화된 데이터로 변환되어 ERP나 그룹웨어에 업로드
된다.
6 │ IDG Summary
수 있고, IQ봇 내에 분류 엔진을 보유하고 있어 추출 결과의 품질을 극대화한다. 결과적으
로 사람이 수동으로 처리하는 송장을 최소화할 수 있다.
성공을 읽는 지능형 문서 처리 구축 전략 │ 7