Home > 전체기사

ETRI, 24개 언어 이해하는 음성인식 기술 개발

  |  입력 : 2022-11-03 10:37
페이스북 보내기 트위터 보내기 네이버 밴드 보내기 카카오 스토리 보내기 네이버 블로그 보내기
글로벌 업체와 대등한 국내 최다언어, 최고성능 음성인식
연내 30개 언어 확보해 희소언어 확장에 걸림돌 해결할 것


[보안뉴스 엄호식 기자] 국내 연구진이 한국어와 영어, 중국어, 일본어뿐만 아니라 독일어, 프랑스어, 스페인어, 러시아어 등 세계 주요 24개 언어를 인식할 수 있는 음성인식 기술을 개발했다. 디지털 전환의 시대, 음성인식을 바탕으로 인공지능(AI) 비서, AI 튜터 등 다양한 AI 서비스 확산에 큰 도움이 될 전망이다.

▲ETRI연구진이 24개 음성인식 기술을 이용, 세계 각국 정상의 연설을 실시간 자막화 하고 있다[사진=ETRI]


한국전자통신연구원(ETRI)은 세계 주요 24개 언어를 음성으로 인식, 문자로 변환할 수 있는 ‘대화형 인공지능(Conversational AI) 기술’을 개발했다고 밝혔다. ETRI가 개발한 음성인식 기술의 성능은 구글(Google) 등 글로벌 업체와 비교해 한국어에서는 우위, 타 언어에서는 대등한 수준이다.

기존에는 음성인식 기술을 개발하기 위해서는 대규모 학습데이터가 필요해 다국어 확장과 음성인식 성능 확보가 쉽지 않았다. 연구진은 △자기 지도학습(Self Supervised Learning : 레이블이 없는 데이터에 대해 인공지능 모델 학습이 가능하게 하는 기술) △의사 레이블(Pseudo Label : 인공지능이 가상의 레이블을 자동으로 생성해 지도 학습하는 기술 적용) △대용량 다국어 사전 학습 모델(Pre-trained Model : 대용량 데이터를 활용해 관련 지식을 미리 학습해놓은 인공지능 모델) △음성 데이터의 오디오 데이터 생성(TTS) 증강 기술 등을 통해 언어 확장의 어려움을 해결했다.

또한, 기존에 흔히 활용되던 종단형(End-to-End) 음성인식 기술의 단점을 개선해 활용성을 높였다. 종단형(End-to-End) 음성인식은 음향 모델과 언어 모델, 발음 사전 등을 별도로 학습하던 이전의 음성인식 기술에서 나아가 종단형(End-to-End) 방식으로 통합 학습하도록 개선하고 음성인식 성능 향상시키는 기술이다. 하지만 통합 학습에 따라 응답속도가 느리고, 의료나 법률 등 특정 도메인에 특화하기 어려운 것이 단점이었다.

이에 느린 응답속도의 문제는 스트리밍 추론 기술을 개발, 실시간 처리가 가능하도록 개선했다. 아울러, 의료와 법률, 과학기술 등 특정한 도메인에 대한 음성인식 특화가 쉽도록 하이브리드 종단형 인식 기술도 개발해 적용했다.

▲종단형 음성인식 기술 개념도[사진=ETRI]


ETRI는 지난 2020년 종단형 음성인식 기술을 개발한 후, 30여 개의 국내·외 기업에 음성인식 기술을 이전했다. 이를 통해 기업들은 △회의록 작성 △자막 통역 △키오스크 △의료·교육 △AI 컨택센터(음성인식, 대화 엔진 등 인공지능(AI) 기술을 활용해 상담, 안내 등 고객센터의 업무를 최적화하는 시스템) 등 다양한 AI 서비스에 ETRI의 음성인식 기술을 활용하고 있다.

연구진은 이번 다국어 확대와 응답 속도 지연 해결 등 신기술 적용을 통해 음성인식 기술 활용 범위를 확대, 사업화를 추진할 예정이라고 밝혔다. 특히, 올해 안으로 지원 언어를 30여 개로 확대하고, 국내·외 전시 참여와 기업체 설명회를 통해 동남아와 남미, 아랍권 등을 대상으로 사업화를 적극 추진할 예정이다.

김상훈 ETRI 복합지능연구실 책임연구원은“국내기술로 글로벌 선도업체와 대등한 수준의 음성인식 기술을 개발했다는 데 의의가 있다. 본 기술이 우리나라 인공지능 분야의 글로벌 경쟁력을 높이고 기술자주권을 확보하는 데 큰 도움이 되길 바란다”고 말했다.

현재 ETRI에서는 공공인공지능 오픈 API·DATA 서비스 포털을 통해 11개 언어의 음성인식 서비스를 제공하고 있다. 또한, 이번 연구성과를 기반으로 24개 언어로 음성인식 서비스를 확대해 중소·벤처기업, 학교, 개인 개발자 등 다양한 사용자들에게 다국어 음성인식 관련 사업 기회를 제공할 예정이다.
[엄호식 기자(eomhs@boannews.com)]

<저작권자: 보안뉴스(www.boannews.com) 무단전재-재배포금지>

  •  
  • 0
  • 페이스북 보내기 트위터 보내기 네이버 밴드 보내기 카카오 스토리 보내기 네이버 블로그 보내기

  •  SNS에서도 보안뉴스를 받아보세요!! 
시큐아이 에스케어 파워비즈 배너 2022년 3월15일 시작~ 12개월 23년 1월12일 수정 위즈디엔에스 2018
설문조사
보안전문 기자들이 뽑은 2023년 보안 핫키워드 10개 가운데 가장 주목되는 키워드는?
보안에서 진짜 ‘핫’한 제로트러스트와 공급망 보안
전문화, 분업화로 더욱 심해지는 랜섬웨어 공포
2023년 클라우드 생태계를 위협할 다양한 보안이슈들
전 국민이 사용하는 스마트폰, 2023년 해커의 집중 타깃
피싱 공격, 새로운 서비스형 위협 ‘PhaaS’로 더 악랄해지다
2022년 말에 터진 서명키 탈취사건, 2023년의 서막에 불과하다
밀집도 모니터링, 지능형 CCTV와 영상분석 트렌드 주도
주 52시간 근무제 달라지나? 정부 정책 따라 출입·근태 인증 보안 시장 요동
메타버스, 주목받는 만큼 증가하는 보안위협
스마트농업 육성 본격화, 보안과 안전 기반 하에 추진돼야