
/ 사진 = 오렌지라이프
OCR(광학식 문자 인식)이란 이미지나 스캔 문서의 글자를 자동으로 인식해 이를 디지털 데이터로 자동 치환하는 기술을 말한다. 오렌지라이프는 신종 코로나바이러스 감염증(코로나19)로 언택트 금융이 본격화한데 따라, 비대면으로 업무를 신속하게 처리할 수 있도록 오픈소스 기반의 ‘AI OCR 플랫폼’을 선보였다.
이 플랫폼은 딥러닝 기술이 적용돼 시간이 지날수록 인식 기능이 보다 정교해지는 점이 특징이다. 작업 정확도를 높이기 위해 보정 등 이미지 전처리 기능을 탑재했다. 특히 오렌지라이프 내부 전문인력이 문자 인식 알고리즘을 자체 개발해 신분증·병원 진단서·공공기관 서류 등 복잡한 서식(표)의 내부 문자 데이터를 추출할 수 있다.
더불어 CPU(중앙처리장치)나 메모리 등 컴퓨터 자원을 필요한 만큼 할당하고 제한할 수 있는 컨테이너 기반 가상화 플랫폼인 도커(Docker)를 적용, 시스템 확장성을 확보하고 비용 절감 효과도 내고 있다. 또 GPU(그래픽처리장치) 병렬 컴퓨팅 플랫폼과 프로그램 모델인 CUDA(병렬 컴퓨팅 솔루션)를 사용해 이미지 접수와 동시에 실시간으로 이미지 처리 데이터를 확인할 수 있다. 사람이 일일이 확인 후 처리해야 했던 서류 작업 프로세스를 획기적으로 향상시킨 셈이다.
오렌지라이프는 보험금 청구 업무에 이 기술을 우선적으로 적용해 대상 고객이 아닌 타인의 개인정보가 서류에 포함됐는지 자동으로 판단, 보험금 착오 지급 등 관련 문제를 사전에 차단하고 보험사기를 조기에 방지할 방침이다. 또 OCR 기술로 빅데이터에 활용할 수 있는 다양한 기초데이터를 축적할 수 있는 만큼, 향후 이를 바탕으로 다양한 비즈니스 기회를 창출해 나갈 예정이다.
한상욱 IT그룹부문 상무는 “오렌지라이프는 디지털 트랜스포메이션 전략에 발맞춰 데이터 분석가, 클라우드 기획자 등 디지털 전문 인재 양성에 오랜 기간 공을 들여왔다"며 "그 결과 AI OCR·빅데이터분석·블록체인 등 3대 플랫폼을 자체 기술력으로 구축하게 됐다”고 말했다.
유정화 기자 uhwa@fntimes.com