마인즈랩, 3인 인상 화자 음성 분리 인식 기술 구현 성공했다
마인즈랩, 3인 인상 화자 음성 분리 인식 기술 구현 성공했다
  • 정회선
  • 승인 2019.06.05 15:41
  • 댓글 0
이 기사를 공유합니다

실제 기술 구현은 최초

“음성 분리 및 필터 기술은 지난 10월 구글이 논문을 공개하며 높은 관심을 받았지만 자체적으로 소스를 공개하지 않아 연구에 어려움을 겪었습니다. 이번에 마인즈랩 브레인팀이 이를 세계 최초로 구현하고 3명 이상의 화자까지 분리하는 데 성공했습니다. 현재 공공과 민간 분야 모두에서 회의록 자동 작성에 대한 기술 수요가 높은 상황인데 이에 빠르게 대처할 수 있게 됐습니다.”(마인즈랩 최홍섭 상무)

인공지능 전문기업 마인즈랩(대표 유태준)은 자사 브레인팀에서 세계 최초로 음성 분리 및 필터(Voice Filter) 기술을 구현하는 데 성공했다고 5일 밝혔다.

두 명의 화자가 겹쳐서 발화하는 음성에서 화자별로 음성을 분리하는 모습(이미지=마인즈랩)

음성 분리 및 필터 기술은 토론회나 회의에서처럼 다수의 화자가 겹쳐서 동시에 발화하는 음성이 있을 때 화자별로 음성을 각각 분리할 수 있는 딥러닝 기술이다.

구글이 지난 10월 논문을 통해 최초로 공개한 적은 있지만 실제 구현체를 공개하지는 않았는데, 마인즈랩이 이 기술을 세계 최초로 구현하고 오픈소스로 공개하는 데 성공한 것이다. 실제로 최근 해당 구글 논문이 업데이트되면서 마인즈랩의 구현 성과가 논문에서도 구체적으로 언급되기도 하였다.  

이번에 마인즈랩이 세계 최초로 구현에 성공한 음성 분리 및 필터 기술은 회의록 자동 작성∙전사, 스마트 오피스 환경 구축 등 고도화된 음성인식 기술이 필요한 분야에서 다양하게 상용화될 수 있다. 마인즈랩은 이번에 구현된 기술을 토대로 가장 높은 기술 수요가 있는 인공지능 회의록 서비스와 인공지능 하이브리드 고객센터 서비스를 구체화하고 강화할 계획이다.

또한 다중 화자 음성인식이 필요한 전 분야에 걸쳐 기술적 한계로 지금까지는 시도하지 못했던 다양한 형태의 음성인식 솔루션을 조만간 마련하는 것도 가능할 것으로 내다보고 있다.

마인즈랩은 인공지능 서비스 플랫폼 마음AI(maum.ai)를 기반으로 인공지능 핵심 알고리즘부터 인공지능 엔진, 플랫폼부터 인공지능 서비스까지 통합적으로 제공하고 있는 인공지능 전문 기업으로, 이미 인공지능와 전통적 고객센터를 통합한 인공지능 하이브리드 고객센터, 인공지능 스마트팩토리 및 스마트 시티 등에서 구체적인 성과를 보이고 있다. 


애독자 메이커님의 활동과 행사를 이미지와 함께 메이커뉴스에 알려주십시오. 어떠한 메이커 소식도 소중하게 다루겠습니다.
ⓔ editor.makernews@gmail.com 페이스북메시지


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.