차지맨 켄!
접속 : 3668   Lv. 69

Category

Profile

Counter

  • 오늘 : 1143 명
  • 전체 : 1515364 명
  • Mypi Ver. 0.3.1 β
[IT | 기술] 두바이 기업, 딥페이크로 조 로건·스티브 잡스 최신 팟캐스트 제작 (0) 2022/10/22 PM 09:03


 

 

최근, 두바이에서 미국 코미디언 조 로건(Joe Rogan)과 애플 창업자 스티브 잡스의 팟캐스트가 공개돼 화제가 되었다. 과거의 팟캐스트가 아닌 두바이 신규 팟캐스트의 ‘첫 번째’ 에피소드였기 때문이다.

Ars테크니카, 기즈모도 등 복수 외신에 따르면, 조 로건과 스티브 잡스의 인터뷰를 담은 팟캐스트는 두바이 합성 음성 기업 ‘Play.ht’가 딥페이크 기술로 제작한 가상의 팟캐스트 인터뷰이다.

팟캐스트는 조 로건 음성으로 시작한다. 이어서 스티브 잡스의 음성이 2000년대 후반 진행된 애플 키노트와 All Things Digital 인터뷰 당시를 회상하며 이야기한다. 두 인물의 음성 모두 실제 목소리와 같이 구현하였다. 에피소드는 총 19분간 진행된다.

가장 흥미로운 부분은 잡스의 음성이 구글, 마이크로소프트, 어도비 등 경쟁사 제품과의 경쟁, 그리고 매킨토시의 성공을 이야기한 부분이다. 모두 잡스가 생전 인터뷰를 통해 밝힌 견해와 비슷한 이야기를 이어간다.

Play.ht 측은 GPT-3와 같은 대규모 언어 모델(LLM)과 같은 인공지능(AI) 기술을 활용해 딥페이크 팟캐스트를 제작했다고 밝혔다.

Play.ht는 공식 웹사이트를 통해 “스티브 잡스의 에피소드는 잡스의 자서전과 생전 인터뷰 음원을 이용해 AI 모델 훈련 과정을 거친 뒤 완성했다. 이후 잡스의 생전 당시 인터뷰를 정확하게 재현해냈다”라고 설명했다. 또, 자막 제작 과정에도 언어 모델을 사용했다고 덧붙였다.

Play.ht 공동 창립자 시예드 하마드(Syed Hammad)는 테크 매체 기즈모도에 보낸 메일을 통해 “AI 대화 툴의 기술력을 입증한다는 취지로 구상한 ‘Podcast.ai’ 프로그램의 일환으로 조 로건과 스티브 잡스의 인터뷰를 제작했다”라고 밝혔다.

하마드는 “잡스의 음성은 잡음이 많이 섞인 인터뷰 현장이나 연설 현장에서의 음성을 이용하여 구현했다. 이 때문에 잡스의 음성 제작 과정에 약간의 기술적 결함이 있었다. 그러나 전반적으로 잡스의 음성을 훌륭하게 구현하는 데 성공했다”라고 덧붙였다.

한편, 미국 테크 매체 Ars테크니카는 잡스와 로건의 음성 구현이 법적으로 문제가 될 가능성은 추후 더 지켜봐야 알 수 있다고 설명했다. 이에서 매체는 “음성 합성 기술이 널리 보급됨에 따라 가짜 음성을 구분하기 어려워지는 상황에서 과거의 인물이 등장하는 픽션 인터뷰가 등장하는 사례가 증가할 것”이라고 전했다.



#인공지능  #AI  #딥페이크  #음성합성 

신고

 
X