한국정보기술진흥원한국인공지능올림피아드 (KOAI) 2026 개최안내

마이크로소프트 연구팀, '인간수준의 성능'을 생성하는 새로운 음성 합성 AI 개발... 오용 위험 등으로 비공개

    1
    thumbnail.webp
    [한국정보기술신문] 마이크로소프트 연구팀은 기존 오디오 소스와 구별할 수 없는 단 몇 초 만의 오디오 만으로 ‘인간 수준의 성능’의 음성을 생성할 수 있는 새로운 음성 합성 AI 시스템인 “VALL-E 2”를 공개했다.
    “신경 코덱 언어 모델의 최신 기술로 제로샷 텍스트-음성 변환(TTS)의 이정표를 세우며 처음으로 인간과의 동등한 단계에 도달했다”고 논문에서 말한다. 2023년 초에 발표한 이전 버전 “VALL-E”를 기반으로 제작되었다.
    연구팀은 VALL-E 2가 다른 음성 복제 기술과의 차별점은 “반복 인식 샘플링” 방법과 샘플링 기술 간의 적응형 전환이라고 설명하여, 이러한 전략은 일관성을 향상시키고 기존 음성 생성 방식에서 흔히 발생하는 문제를 해결한다고 설명했다. 또한, “VALL-E 2는 복잡하거나 반복적인 구절로 인해 기존 방식에서 해결하지 못했던 어려운 문장에서도 일관되게 고품질의 음성을 제공한다”며, “이번 기술이 말을 할 수 없는 사람들을 위해 음성을 생성하는데 도움이 될 수 있다”고 강조했다.
    그러나, 이 기술은 대중에게 공개되지 않을 예정이다. “현재로서는 VALL-E 2를 제품에 추가하거나, 대중에게 공개할 계획은 없다”고 마이크로소프트는 윤리 성명서에서 밝혔으며, 이러한 기술이 동의 없이 음성 모방이나 사기 등의 범죄 등에서 사용될 수 있는 위험이 있다고 지적했다. 또한, AI 생성 콘텐츠가 AI인지 아닌지 여부를 판별하는 것이 여전히 어려운 문제로 남아있다며, 해당 생성물에 대해 디지털 워터마크를 표기해야하는 필요성에 대해 강조했다.
    image.png
    VALL E-2를 포함한 다른 음성 합성 기술과 인간 기준치와의 비교 그래프 / Microsoft 제공
    VALL E-2의 음성 합성 결과는 다른 기술에 비해 매우 정확하며, 연구팀이 수행한 테스트에서 VALL E-2의 생성된 음성은 견고성, 자연스러움, 유사성 기준에서 인간의 기준치를 초과했다.
    OpenAI 측은 우선 보안 문제를 먼저 해결해야 하며, “우리의 AI 안전 접근 방식 및 자발적 약속에 따라, 이 기술을 현재는 널리 공개하지 않기로 결정했다”고 OpenAI는 공식 블로그에서 설명했다.
    대외협력본부 한국정보기술신문 | news@kitpa.org

    함께 읽으면 좋은 기사

    게임 트리 알고리즘, 인공지능 의사결정의 뼈대로 주목...미니맥스·알파베타 가지치기가 핵심 원리

    게임 트리 알고리즘, 인공지능 의사결정의 뼈대로 주목...미니맥스·알파베타 가지치기가 핵심 원리

    인공지능 2
    정부, 8천억대 국산 '온디바이스 AI반도체' 개발 국책사업 확정...자동차·가전·로봇·방산 4대 업종에 풀스택 지원, 6월 공고해 7월 착수

    정부, 8천억대 국산 '온디바이스 AI반도체' 개발 국책사업 확정...자동차·가전·로봇·방산 4대 업종에 풀스택 지원, 6월 공고해 7월 착수

    인공지능 · 반도체 · 유관기관 3
    구글, 자사 AI로 'I/O 2026' 행사 직접 제작...제미나이·나노 바나나 전면 투입

    구글, 자사 AI로 'I/O 2026' 행사 직접 제작...제미나이·나노 바나나 전면 투입

    인공지능 2
    애플, 접근성 기능 이유로 받아쓰기 앱 등록 거부...손 부상 개발자, 앱 두 버전으로 갈라 대응

    애플, 접근성 기능 이유로 받아쓰기 앱 등록 거부...손 부상 개발자, 앱 두 버전으로 갈라 대응

    정보기술 2
    엔비디아, AI·RTX 그래픽 합친 'RTX 스파크 슈퍼칩' 공개...슬림 노트북·소형 데스크톱 겨냥

    엔비디아, AI·RTX 그래픽 합친 'RTX 스파크 슈퍼칩' 공개...슬림 노트북·소형 데스크톱 겨냥

    정보기술 · 인공지능 3
    파이러트베이, 압수수색 20년 지나도 건재...사흘 만의 부활이 단속을 무색하게 만들다

    파이러트베이, 압수수색 20년 지나도 건재...사흘 만의 부활이 단속을 무색하게 만들다

    정보기술 2
    롤·발로란트도 ARM 윈도우서 돌아간다...라이엇, 인기 게임 지원 공식화

    롤·발로란트도 ARM 윈도우서 돌아간다...라이엇, 인기 게임 지원 공식화

    정보기술 1
    엔비디아, 윈도우용 AI 슈퍼컴퓨터 'DGX 스테이션' 공개...GB300 기반으로 1조 파라미터 모델 로컬 구동, 올해 4분기 출시

    엔비디아, 윈도우용 AI 슈퍼컴퓨터 'DGX 스테이션' 공개...GB300 기반으로 1조 파라미터 모델 로컬 구동, 올해 4분기 출시

    인공지능 · 정보기술 4
    앤트로픽, 최상위 모델 '클로드 오푸스 4.8' 출시...벤치마크 끌어올리고 '노력 제어'·'동적 워크플로'로 협업 강화, 가격은 그대로

    앤트로픽, 최상위 모델 '클로드 오푸스 4.8' 출시...벤치마크 끌어올리고 '노력 제어'·'동적 워크플로'로 협업 강화, 가격은 그대로

    인공지능 4
    산업통상부, 부내 행정업무에 AI 도입 본격 추진...AI 혁신 자문단 출범하고 거버넌스·서비스·역량 3대 과제 가동

    산업통상부, 부내 행정업무에 AI 도입 본격 추진...AI 혁신 자문단 출범하고 거버넌스·서비스·역량 3대 과제 가동

    유관기관 · 인공지능 2
    개인정보위·프랑스 CNIL, 아동·청소년 'AI 안전 사용' 포스터 공동제작...질문 6가지로 풀어내 전국 초·중·고에 배포

    개인정보위·프랑스 CNIL, 아동·청소년 'AI 안전 사용' 포스터 공동제작...질문 6가지로 풀어내 전국 초·중·고에 배포

    정보보안 · 유관기관 2
    구글, 제미나이 기반 새 광고 포맷으로 검색 광고 'AI 시대' 연다...대화형 광고·AI 쇼핑 광고 도입하고 다이렉트 오퍼 시범사업 확대

    구글, 제미나이 기반 새 광고 포맷으로 검색 광고 'AI 시대' 연다...대화형 광고·AI 쇼핑 광고 도입하고 다이렉트 오퍼 시범사업 확대

    인공지능 3