본문 바로가기

최근 소식

[AI다국어 음성 번역] 구글 AI 새로운세계를 시작하나?

반응형

구글AI(출처: VENTURE SQUARE)

구글은 인공지능을 통한 세상의 변화를 선도하기 위해 엄청난 투자를 하고 있습니다. 그 결과인지 구글은 인공지능 분야에 있어서 가장 선두를 달리고 있습니다. 구글 AI는 인공지능을 전담하는 부서입니다. 구글 AI가 3월 스타트업 앤트로픽에 3억 달러를 투자했습니다. 앤트로픽은 대규모 언어모델 AI를 연구하는 기업입니다. 

 

구글 AI는 왜 언어모델 AI회사에 투자하는가

 한 언어를 다른 언어로 번역한다는 것은 서로 의사소통을 할 수 없는 두 그룹의 사람들이 의사소통을 통해 문화와 정보를 교류할 수 있다는 것을 의미합니다. 이것은 시장이 혁신적으로 확대되고 시장에서 판매되고 소비되는 재화와 정보의 양이 폭발적으로 늘어난다는 것입니다. 초창기 번역사이트 혹은 앱의 번역 결과를 보면 수박 겉핥기식의 어설픈 번역이었습니다. 하지만 번역 엔진에 AI를 적용하면서 어마어마한 데이터를 축적하고 분석하면서 최근의 번역 엔진은 놀라울 정도로 정확한 번역에 근접해가고 있습니다. 구글 AI는 전 세계에서 가장 큰 장벽 중 하나인 언어의 장벽을 무너뜨리려는 도전을 하고 있습니다.

 

CoVoST 이미지 모델(출처: 인공지능 신문)

CoVoST란

CoVoST는 대규모 다국어 음성-텍스트 번역 코퍼스를 말합니다. 코퍼스란 우리말로 '말뭉치'로 번역할 수 있습니다.  
구글은 음성-음성 간 번역을 위한 연구와 인공지능 음성 변환 애플리케이션의 개발을 더욱더 가속화시키기 위해 21개 언어에 대한 영어 번역을 위한 음성 변환 코퍼스 CVSS를 오픈소스로 공개했습니다. CVSS에는 1872시간과 1937시간의 음성이 포함되어 있으며, 번역음성, 번역 음성의 발음과 일치하는 정규화된 번역 텍스트도 지원하고 있습니다. 

 

반응형

이로 인해 벌어진 미래의 모습

인공지능이 적용된 번역의 특징은 빠른 속도로 매우 정확하게 번역하면서도 비용을 절감할 수 있으며 언제 어느 때든 원하는 순간 번역 서비스를 편리하게 내가 원하는 방식으로 제공받을 수 있다는 점입니다. 거기에 더해 CVSS와 같은 대규모 다국어 음성대 음성, 음성대 텍스트 번역 코퍼스가 적용되면 말 그대로 세상의 모든 언어에 대한 번역이 가능해집니다. 이러한 특징으로 인해 사람들은 외국어를 공부할 필요가 사라지며 수많은 언어 및 언어교육에 관련된 직업들이 사라질 것입니다. 또한 학습을 통한 인공지능의 발전으로 실시간 통역정보를 귀로 듣고 망막이나 안경에 투사하는 방식을 통해 외국어 문서에 대한 번역을 실시간으로 할 수 있습니다. 

 

언어모델 AI가 보여주는 번역능력의 한계는 현재 명확합니다. 특히 문학작품에 대한 번역은 원저자의 저작의도를 고려해야 하기 때문에 AI 번역이 풀어낼 수 없는 숨겨진 의미들이 있습니다. 하지만 AI들은 엄청나게 빠른 속도로 학습해 나가며 자신의 한계를 돌파하고 있습니다. 특히 인간이 작성한 문서의 문법적 오류를 고치고 더욱 세련된 표현으로 바꿔주는 등의 기능은 지금도 활발하게 이용되고 있습니다. 즉 일상생활의 단순한 번역의 경우는 번역의 결과가 매우 좋은 품질을 보여준다는 것입니다. 이는 곧 인류가 언어의 장벽을 극복하도록 AI는 진화할 것을 보여줍니다.  이 기술을 어떻게 사용할지는 인간에게 주어진 숙제입니다.

 

반응형
LIST