카카오엔터프라이즈에서 고객사가 직접 기능을 수정할 수 있는 음성 인식-텍스트 변환 모델을 내놨다.

카카오엔터프라이즈는 기업용 인공지능(AI) 음성 인식-텍스트 변환 모델 ‘커스텀 STT(Custom Speech-to-Text)’를 25일 공개했다.
 
카카오엔터프라이즈, 고객 맞춤형 AI 음성인식-텍스트 변환 모델 내놔

▲ 카카오엔터프라이즈 로고.


STT는 AI를 활용해 음성을 텍스트로 변환해주는 기능으로 인공지능(AI) 스피커, 음성 검색, 내비게이션 등 다양한 용도로 활용되고 있다.

카카오엔터프라이즈가 공개한 커스텀 STT는 고객사가 직접 단어와 패턴을 추가하면 가장 적합한 AI 모델을 빠른 시간 내 자동으로 만들어준다. 

고유명사나 길고 복잡한 단어 처리도 가능하다. 

실제 내부실험 결과 음성인식 오류율이 기존과 비교해 30% 이상 개선된 것으로 전해졌다.

커스텀 STT는 클라우드 기반의 '서비스형 AI(AIaaS)'로 기업의 서비스 관리 시간과 비용 부담을 해소할 수 있다는 점도 장점으로 평가된다.

기존 STT 서비스를 수정, 개발 하려면 고객사가 직접 요청사항을 정리해 개발사에 전달하고 개발사가 해당 모델을 재개발해야 하는 과정을 거쳐야 한다. 

카카오엔터프라이즈는 상반기 오픈 할 ‘카카오 i 커넥트 센터(AICC)’의 문의응대나 상담 업무 등에도 커스텀 STT를 적용한다. 

음성인식(STT) 뿐만 아니라 문자인식(OCR), 음성합성(TTS) 분야의 보유 기술도 커스텀이 가능한 서비스형 AI(AIaaS) 모델로 순차 공개한다.

카카오엔터프라이즈는 앱 프로그래밍 인터페이스(API)로 AI 서비스를 바로 만들 수 있는 서비스형 AI 고도화에 기술 역량을 집중한다는 계획도 내놨다.

최동진 카카오엔터프라이즈 AI 랩(Lab)장은 "커스텀 STT는 고객사가 직접 데이터를 추가해 자동 학습을 진행하고 커스텀 모델을 만들기 때문에 AI 재학습과 업데이트 소요시간을 크게 단축할 수 있다"며 "기업들은 신속하게 데이터를 변경, 추가해 사용자들에게 새로운 정보를 빠르게 전달하고 더 편리한 경험을 제공할 수 있을 것이다"고 말했다. [비즈니스포스트 안정문 기자]