인공지능 ·
OpenAI, 차세대 영상생성 AI 'Sora 2' 공개...AI 소셜미디어 플랫폼도 론칭
ChatGPT 개발사 OpenAI가 영상 및 음성 생성 AI 모델 'Sora 2'를 공개하고, AI 생성 영상 전용 소셜 플랫폼 'Sora 앱'을 동시 출시했다.
[한국정보기술신문] OpenAI가 9월 30일(현지시간) 차세대 영상 및 음성 생성 인공지능 모델 Sora 2를 공식 발표했다. 이와 함께 AI 생성 영상을 공유하는 소셜 미디어 플랫폼 Sora 앱도 동시에 출시하며, 생성형 AI 시장에서 새로운 도전장을 내밀었다.
OpenAI는 공식 블로그를 통해 Sora 2가 2024년 2월 공개된 초대 모델 대비 현저히 향상된 성능을 보인다고 밝혔다. 회사는 이번 출시를 영상 생성 AI의 GPT-3.5 모멘트라고 표현하며, 물리 법칙 준수와 사실적 표현력이 대폭 개선됐다고 강조했다.
물리 법칙 이해도 향상, 음성 생성 기능 추가
Sora 2의 가장 큰 개선점은 현실 세계의 물리 법칙을 더욱 정확하게 반영한다는 점이다. 기존 모델이 농구공이 골대를 벗어나면 순간이동하는 등 비현실적인 장면을 생성했다면, Sora 2는 농구공이 백보드에서 튕겨 나오는 등 실제 물리 현상을 정확히 구현한다.
또한 Sora 2는 이전 버전과 달리 영상과 동기화된 음성 및 효과음을 생성할 수 있다. 올림픽 체조 루틴, 패들보드 백플립, 피겨 스케이팅 트리플 악셀 등 복잡한 동작을 사실적으로 표현하는 시연 영상이 공개됐다.
카메오 기능으로 본인 모습 영상 삽입
Sora 2의 핵심 기능 중 하나는 카메오(Cameo) 기능이다. 사용자는 일회성 영상 및 음성 녹화를 통해 본인 확인을 거친 후, 자신이나 친구의 모습을 AI 생성 영상에 삽입할 수 있다. OpenAI 연구원 Gabriel Petersson은 자신과 CEO 샘 올트먼의 모습이 등장하는 시연 영상을 공개해 화제를 모았다.
이 기능은 본인 동의를 전제로 하며, 사용자는 언제든지 자신의 초상 사용 권한을 철회할 수 있다. 다만 타인이 악용할 가능성에 대한 우려도 제기되고 있다.
TikTok 스타일 소셜 플랫폼 출시
OpenAI는 Sora 2와 함께 iOS 전용 소셜 미디어 앱 Sora도 출시했다. 이 앱은 TikTok과 유사한 알고리즘 기반 피드를 제공하며, 모든 콘텐츠가 AI로 생성된다는 점이 특징이다.
사용자는 앱 내에서 영상을 생성하고, 다른 사용자의 작품을 리믹스하거나 발견할 수 있다. 알고리즘은 사용자의 Sora 활동, IP 주소 기반 위치 정보, 과거 게시물 참여도, ChatGPT 대화 기록 등을 고려해 맞춤형 추천을 제공한다.
초대제로 미국·캐나다 우선 출시
Sora 앱은 현재 미국과 캐나다에서 다운로드할 수 있지만, 서비스 접근은 초대제로 운영된다. 일부 얼리 액세스 사용자에게 직접 초대장이 발송되며, 이들은 제한된 수의 친구 초대권을 받는다.
향후 몇 주간 Sora 1 파워 유저, ChatGPT Pro 구독자, Plus 및 Team 플랜 사용자 순으로 우선 접근권이 부여될 예정이다. ChatGPT Pro 구독자는 초대 없이 실험적 고품질 모델인 Sora 2 Pro를 sora.com에서 이용할 수 있다.
저작권 및 딥페이크 논란
Sora 2 출시와 함께 저작권 침해 우려가 재점화됐다. 로이터 통신에 따르면 OpenAI는 TV 및 영화 제작사를 포함한 저작권자들이 자신의 작품이 Sora 2의 영상 피드에 나타나지 않도록 직접 옵트아웃해야 하는 정책을 유지하고 있다. 이는 기본적으로 모든 콘텐츠를 학습에 포함시키는 방식으로, 저작권자의 사전 동의 없이 작품을 사용한다는 비판을 받고 있다.
또한 출시 첫날 샘 올트먼 CEO가 타깃에서 컴퓨터 부품을 훔치는 영상이 제작되는 등, 실존 인물이 범죄를 저지르는 딥페이크 콘텐츠가 쉽게 생성될 수 있다는 우려도 제기됐다.
안전장치 마련
OpenAI는 이러한 우려에 대응하기 위해 여러 안전장치를 마련했다고 밝혔다. Sora 앱 또는 sora.com에서 다운로드한 모든 영상에는 움직이는 워터마크가 삽입되며, AI 시스템으로 생성됐음을 나타내는 비가시적 메타데이터도 포함된다.
카메오 기능은 옵트인 방식으로 운영되며, 영상 및 음성 캡처를 통한 본인 확인이 필수다. 공인은 본인이 직접 카메오를 업로드하지 않는 한 생성될 수 없다. 모든 영상에는 C2PA 출처 메타데이터와 가시적 워터마크가 포함되며, 청소년 계정의 경우 콘텐츠 필터와 DM 제한 기능을 제공한다.
OpenAI는 영상 길이를 10초로 제한하고, 사실적인 인물이 포함된 이미지 업로드와 모든 영상 업로드를 제한하는 등 단계적 배포 전략을 취하고 있다. 특히 미성년자와 관련된 콘텐츠에는 엄격한 안전장치와 검열 기준을 적용하고 있다.
OpenAI는 향후 API를 통한 개발자 접근도 제공할 예정이며, 사용자 피드백을 바탕으로 안전성과 창의성의 균형을 맞춰나갈 계획이라고 밝혔다.
한국정보기술신문 인공지능분과 박정후 기자 news@kitpa.org