차지맨 켄!
접속 : 3668   Lv. 69

Category

Profile

Counter

  • 오늘 : 688 명
  • 전체 : 1514909 명
  • Mypi Ver. 0.3.1 β
[IT | 기술] AI로 만든 커버곡, 문제없을까? (0) 2023/11/12 PM 03:51

데이터로 보는 생성형 AI



✏️ 마부뉴스 네 줄 요약

 

생성형 AI는 이용자의 요구에 따라 결과를 능동적으로 생성해 낼 수 있습니다. ChatGPT처럼 대규모 언어 데이터를 학습해 결과물을 만드는 LLM이 생성형 AI의 대표 주자입니다.


음악 생성, 그림 생성 AI의 화두는 저작권 보호입니다. AI 커버곡 같이 음원 원작자의 허락 없이 생성된 콘텐츠는 저작권법 위반 문제가 있습니다.


생성형 AI 관련 제도와 대책이 없는 사이 범죄나 가짜 뉴스에 악용되는 사례가 속속 등장하고 있습니다. 미국 등 주요 국가에선 관련 규제를 마련하고 있습니다.


AI 기술을 다루는 기업과 학계에서는 기술 발전으로 인해 놓칠 수 있는 영역들을 스스로 점검해 보고 관리하는 ‘책임 있는 AI(Responsible AI)’의 목소리가 나오고 있습니다.

 


img/23/11/12/18bc24a9de62255ed.webp



독자 여러분 안녕하세요. 지난주 마부뉴스 뉴스레터 낙서장에서는 독자 여러분에게 “가을 하면 생각나는 노래”를 질문했습니다. 낙서장을 보니 정말 좋은 노래들이 적혀 있더라고요. 마부뉴스 제작진들의 가을철 노동요는 한동안 걱정 안 해도 될 것 같습니다. 물론 최근 날씨가 가을이라고 말하긴 힘들 정도로 갑자기 추워지긴 했지만요😭


낙서장엔 적지 않았지만 마부뉴스 제작진들이 숨어서 듣는 노래가 있습니다. 바로 디오와 수현이 부른 , 그리고 박효신이 부른 <헤어지자 말해요>죠. "이 가수들이 언제 이런 곡을 불렀지?" 싶겠지만, 두 곡 모두 AI가 만든 노래입니다. 디오와 수현은 '더 시즌즈'에서 의 일부만 불렀지만 AI 기술을 통해 완곡으로 재탄생되었고, 박효신의 곡 역시 박재정의 발라드 곡에 2003년도 박효신 목소리를 학습시켜 새로운 노래가 나온 겁니다. AI 커버곡의 조회수가 몇 백만을 기록하는 오늘날, 마부뉴스가 독자 여러분에게 던지는 질문은 바로 이겁니다.


AI로 만든 커버곡, 문제없을까?



생성형 AI, 어디까지 왔을까?


우선 생성형 AI가 무엇인지 간단히 정리해 보겠습니다. 생성형 AI는 이름에서 유추할 수 있듯, 무언가를 만들어내는 AI 인공지능을 의미합니다. 기존의 AI와는 다르게 이용자의 요구에 따라 결과를 능동적으로 생성해 낼 수 있다는 특징이 있죠. 예전 AI 기술은 기존의 데이터를 기반으로 예측하고 분류하는 정도였다면, 생성형 AI는 이용자가 제시한 과제를 해결하기 위해 스스로 데이터를 찾아 학습합니다.


가장 대표적인 생성형 AI는 ChatGPT로 대표되는 LLM(Large Language Model) 일 겁니다. LLM은 대규모의 언어 데이터를 학습해 결과물을 만드는 모델이죠. 오픈AI의 ChatGPT가 세상에 등장하면서 센세이션을 일으켰고, 뒤이어 수많은 LLM 모델들이 등장했어요. 메타에선 LLaMa라는 모델을, 구글에선 Bard를 선보였죠. 이에 뒤질세라 오픈 AI도 새로운 버전들을 공개했는데요. 현지시각으로 11월 6일, 오픈 AI는 책 300쪽 분량의 질문도 거뜬히 해결해 내는 가장 최신 모델인 GPT-4 터보를 공개했습니다.


언어 모델뿐 아니라 이미지와 음성, 그리고 영상을 생성하는 모델도 있습니다. 예전 <AI가 내 사진을 마음대로 가져간다면?> 레터에서도 소개했지만 텍스트를 이미지로 바꿔주는 미드저니 같은 생성형 AI 서비스도 있고, 텍스트를 음성으로 변환하는 Eleven Labs 같은 서비스도 있죠.


img/23/11/12/18bc24b66362255ed.webp


생성형 AI 모델들의 역사를 확인할 수 있는 데이터를 가져와봤습니다. 위 그래프는 데이터 사이언티스트인 David Foster의 자료를 바탕으로 그려본 생성형 AI 모델들의 연대기입니다. 그래프에는 생성형 AI 모델 별로 타입을 나누어서 밀도 그림을 그려봤는데, 2021년 이후 특히 더 많이 붐업되고 있는 영역 두 군데가 보일 거예요. 하나는 ChatGPT 같은 LLM에 큰 영향을 준 트랜스포머(Transformer) 모델이고, 또 하나는 멀티모달입니다.


멀티모달은 멀티(Multi)와 모달리티(Modaltiy)를 합쳐서 만든 용어입니다. 여기서 이야기하는 모달리티는 양식, 양상을 의미하죠. 멀티모달은 시각 정보, 청각 정보 등을 비롯해 다양한 양식을 통해 정보를 주고받는 모델을 뜻합니다. 독자 여러분 중에 ChatGPT를 써 본 분이 있다면 아마 이해가 한 번에 될 겁니다. GPT-3 버전의 ChatGPT에선 텍스트로만 의사소통이 가능했지만, GPT-4부터는 텍스트뿐 아니라 이미지로도 대화가 가능하거든요. 그러니까 텍스트뿐 아니라 이미지를 보고 스스로 이해하고 처리할 수 있는 GPT-4 모델은 멀티모달 모델이라고 할 수 있죠.

 

img/23/11/12/18bc24bb14a2255ed.webp


생성형 AI에 대해 늘어난 관심은 글로벌 기업들의 실적 발표 행사에서도 확인할 수 있습니다. IoT 시장 동향을 발표하는 IoT Analytics에서는 분기마다 보고서를 발표하고 있어요. 글로벌 상장 기업들은 분기별로 실적을 발표하고, 다음 분기 땐 어떻게 기업을 운영하겠다는 전망을 발표하는 '어닝콜' 행사를 진행하는데, 보고서에는 여기서 나온 주제와 키워드를 분석한 자료가 담겨 있죠. 2023년 3분기까지 핵심 키워드는 역시 AI와 생성형 AI였습니다. 3분기에 진행한 어닝콜 중 29%에서 AI 키워드가 등장했고, 생성형 AI도 지난 2분기 대비 언급량이 56%나 상승했습니다.


CEO들의 관심과 전망이 AI를 향한 만큼 자본도 모이겠죠? 글로벌 시장조사기관인 프레지던스 리서치(Precedence Research)에서 파악한 2022년 전 세계 AI 시장 규모는 4,541억 2,000만 달러입니다. 그런데 10년 뒤인 2032년에는 그 규모가 2조 5,751억 6,000만 달러로 성장할 것으로 예상되고 있어요. 엄청난 규모입니다.



저작권 보호와 기술 발전 사이


투자도 늘어나고, AI 기술도 속속 등장하는 덕에 우리는 과거엔 경험하지 못한 콘텐츠를 소비하고 있습니다. 우선 존 레논과 조지 해리슨이 하늘의 별이 되었지만 우리는 비틀즈의 신보를 들을 수 있게 됐죠. 독자 여러분도 아마 소식 들었을 겁니다. 11월 2일, 비틀즈의 마지막 노래 이 담긴 싱글 앨범이 발매됐습니다. 1970년대 데모로 녹음한 30대의 존 레논의 목소리에다 1995년 조지 해리슨의 기타 연주, 그리고 현재의 폴 매카트니의 목소리와 링고 스타의 드럼 연주가 만나서 탄생한 곡이죠. 비틀즈의 마지막 신곡은 미국 아이튠즈 차트 1위에 오르는 기염을 토하기도 했습니다.


비틀즈뿐 아니라 고인이 된 뮤지선들을 AI로 되살린 사례는 많습니다. 거북이의 리더이자, 심근경색으로 사망한 터틀맨 음성을 AI로 복원하기도 했고요. 김현식, 신해철 등의 뮤지션을 되살려 그들의 목소리를 듣는 건 이제 특별한 일이 아니게 되었죠. 물론 일각에서는 고인을 돈벌이에 이용한다는 비판도 있는 게 사실입니다. 또 한편으로는 그만큼 뮤지션을 추억하고 싶어 하는 팬들을 위한 콘텐츠가 될 수 있다고 옹호하는 목소리도 있고요.


하지만 문제는 저작권자의 허락 없이 나온 AI 콘텐츠들입니다. 위에서 얘기한 것들은 유족들과 합의를 거쳐서 나온 것이니 만큼 문제가 없지만, 그렇지 않은 AI 커버곡들은 상황이 다르니까요.


일단 우리나라의 저작권법에서 규정하는 저작물에 목소리는 포함되어 있지 않습니다. 그러니까 다른 사람의 목소리 자체를 활용해서 무언가를 만드는 건 저작권 침해라고 할 순 없죠. 그렇다면 괜찮은 걸까요? 그렇진 않습니다. 왜냐하면 목소리에는 없는 저작권이 음원에는 있거든요. 즉 음원을 활용해 만들어진 AI 커버곡은 저작권자의 허락을 받지 않았다면 저작권법 위반입니다. 게다가 목소리가 저작권은 없지만 헌법상의 기본권을 가진다는 취지로 '음성권'이 인정된 바 있기 때문에 헌법 위반 여지가 있기도 하죠.


img/23/11/12/18bc24bff512255ed.webp


하지만 그럼에도 불구하고 AI 커버곡은 많은 사람들에게 선택받고 있습니다. 기업들이 수요가 몰리는 상품을 두고 가만히 있지는 않겠죠. 구글과 유니버설 뮤직은 이런 딥페이크 음악을 합법화하는 방안을 발 빠르게 추진 중입니다. 생성형 AI를 활용해 합법적으로 음반을 제작할 수 있는 허가증을 부여하는 식으로 말이죠. 물론 저작권 소유자가 정당한 대가를 받을 수 있는 장치도 마련될 예정입니다.


음악계는 신중한 입장을 갖고 있어요. 정당한 대가를 보장받는 건 당연한 일이지만 이렇게 만들어진 '가짜 음악' 때문에 '진짜 음악'의 가치가 훼손될 가능성은 없는지 걱정하고 있는 거죠. 우리나라도 지난 10월 26일에 생성형 AI와 저작권을 주제로 포럼이 열리면서 관련 논의를 이어오고 있습니다. 저작권 보호와 기술 발전, 독자 여러분은 어떻게 생각하나요?



범죄에 악용되는 생성형 AI


관련 제도와 대책이 없는 사이 생성형 AI가 범죄나 가짜 뉴스 생성에 악용되는 사례가 속속 등장하고 있습니다. 당장 옆나라 일본에선 기시다 총리가 니혼테레비 뉴스 프로그램에 등장해 성적인 발언을 하는 영상으로 한바탕 난리였죠. 당연히 생성형 AI를 이용해 만든 가짜 영상이었습니다.


캐나다에선 아들의 목소리를 생성형 AI를 이용해 조작한 뒤, 부모에게 사기를 친 보이스피싱 범죄가 발생한 적도 있었습니다. 아들의 목소리를 들려주며 2만 1,000 캐나다 달러 규모의 암호화폐를 송금하라고 하니... 안 속을 사람이 있을까요? 영국에서는 회사 CEO의 목소리를 조작해 24만 3,000달러를 송금하는 금융 사기가 발생하기도 했고요.


뿐만 아니라 생성형 AI는 정치적으로도 악용되고 있습니다. 아래 지도는 인권 옹호 단체인 프리덤하우스가 발표한 보고서에서 가져온 자료인데, 조사 결과 47개 국(초록색)에선 친정부 세력들이 온라인에서 정보를 조작한 사례가 발견됐습니다. 미얀마에선 군부가 자체적으로 허위 정보 조직을 운영했고, 키르기스스탄에선 하루에 150개의 가짜 프로필을 생성하는 AI 생성 봇 기업에게 35만 달러를 지불하기도 했죠.


img/23/11/12/18bc24c318d2255ed.webp



노란 점으로 표시된 16개 나라에선 생성형 AI가 정치적 이슈에 직접적인 영향을 미치기도 했습니다. 브라질에선 작년 10월 대통령 선거 결선 투표를 앞두고 가짜 정보가 담긴 딥페이크 동영상이 유포되기도 했고, 올해 3월 대규모 시위로 혼란스러웠던 프랑스에선 노인이 경찰에게 구타당하는 조작된 이미지가 SNS에 돌아다니기도 했죠.


악용 사례가 속속들이 등장하자 각 국가들은 서둘러 규제안을 내놓고 있습니다. 올해 1월 바이든 대통령이 성소수자를 폄훼하는 연설이 담긴 가짜 영상이 유포되면서 홍역을 치른 미국은 10월 30일 생성형 AI를 강력히 규제하는 행정명령을 내놓았어요. 이 행정명령에는 AI로 생성되는 콘텐츠에 대해 워터마크를 표기하거나 관련 표준안을 만드는 내용이 포함돼 있죠. 뿐만 아니라 앞으로 국가 안보나 경제, 보건 등에 큰 영향을 줄 수 있는 AI 모델은 개발 단계에서부터 미국 정부에 보고해야 합니다.


중국과 유럽에서도 AI 관련된 규제법이 나오고 있습니다. EU는 미국보다 먼저 2021년에 AI 규제법 초안을 마련했고, 회원국 간의 논의가 진행 중이죠. EU의 AI 규제법에는 AI의 위험 수준에 따라 기업이 따라야 할 의무를 구체적으로 적어 두었습니다. 중국도 생성형 AI 서비스를 철저히 관리하기 위한 가이드라인과 규제안을 지난 10월에 발표했고요.



기술엔 기술로 대응하겠습니다


정부가 제도를 통해서 생성형 AI를 들여다보고 있다면, 다른 쪽에선 기술로 기술에 대응하려는 시도가 이어지고 있습니다. 기업과 학계에서 기술 발전만 생각하다가 놓칠 수 있는 영역들을 스스로 점검해 보자는 취지의 목소리가 나오고 있거든요. AI 기술을 책임감 있게 사용하고, 대응하자고 등장한 이른바 '책임 있는 AI 기술(Responsible AI)'입니다.


시카고 대학교의 벤 자오 교수팀이 개발한 '나이트셰이드'라는 기술이 대표적입니다. 이 기술은 이미지생성 AI 모델이 저작권자에게 허락을 받지 않고 무분별하게 데이터를 수집하는 걸 막기 위해 등장했어요. 나이트셰이드를 적용한 이미지가 모델에 수집될 경우, AI 모델은 학습 과정에서 오작동을 일으키게 됩니다. 이미지의 픽셀을 미세하게 바꿔서 모델을 속이는 거죠.


img/23/11/12/18bc24c6c522255ed.webp


오염된 픽셀이 모델에 들어가면, 모델에 개를 입력해도 개가 나오지 않게 됩니다. 대신 고양이가 나오죠. 모자를 그려달라고 입력해도 토스터기가 나오는 식으로 모델의 성능을 떨어뜨립니다. 이 기술이 특히 효과적인 건 단순히 '개'라는 단어에만 영향을 미치는 게 아니라 '강아지', '허스키', '늑대'와 같이 유사한 개념에도 영향을 준다는 겁니다. 이렇게 되면 모델을 만드는 기업들 입장에서도 모델 효율을 높이기 위해선 오염되지 않은 이미지를 사용해야 하고, 그러기 위해선 저작권자의 권한을 인정할 수밖에 없게 되겠죠.


다만 이 알고리즘은 악용될 여지가 있습니다. 모델의 능력을 저하시킬 불순한 목적으로 오염된 데이터를 공개적으로 뿌려버린다면 어떻게 될까요? 그렇게 되면 전체적으로 모델의 효율이 떨어지게 될 겁니다. 말 그대로 무분별한 테러인 셈이죠. 물론 강력한 AI 모델에 오염 데이터가 영향을 주려면 상당한 양의 오염 샘플이 필요할 겁니다. 하지만 전문가들은 현대의 모델에 오염 공격이 이뤄진 실제 사례는 없지만, 충분히 가능성이 있다며 방어 수단을 마련해야 한다고 조언하고 있어요.


딥페이크를 판단하는 기술을 발전시키는 사람들도 있습니다. 앞서 영국에서 조작된 CEO의 음성으로 금융 사기 범죄가 발생했다고 했잖아요? 사건이 발생한 영국에선 조작된 음성을 탐지할 수 있는 연구가 본격적으로 진행되고 있습니다. 우리나라에서도 위조된 음성의 특징을 딥러닝으로 판별하는 모델 기술을 연구 중입니다. 인텔에서는 책임 있는 AI 노력의 일환으로 딥페이크 동영상 탐지 기술을 개발해 공개했죠. 학계에서도 딥페이크 비디오에서 조작된 부분을 감지해 내는 모델을 개발했고요.



발전이 먼저일까? 보호가 먼저일까?


한동안 AI 영역은 자본과 인력, 그리고 정책의 중심에 자리 잡을 겁니다. 그중에서도 생성형 AI는 그 영역 안에서도 독보적인 위치에 있겠죠. ChatGPT로 검색의 판이 뒤바뀌었고, 다양한 생성형 AI를 활용해 업무생산성을 높일 방법은 무궁무진해졌어요. 단순히 이미지 생성과 음성 생성에 그치는 게 아니라 바이오 기업 같은 곳에선 이미 신약 개발에도 활용할 정도니까요.


생성형 AI 기술 진보가 너무나 밝은 탓일까요? 그 그림자에 대한 우려도 커지고 있습니다. 아직까지 제도가 정비되지 않아서 저작권자에 대한 보호는 기대하기 어렵고, 그 사이 가짜 뉴스와 범죄에 기술이 악용되면서 문제가 발생하고 있습니다.


AI 기술 발전의 파급력을 고려해서 데이터 학습을 인정해줘야 한다는 입장. 반면 기술 발전도 중요하지만 개인의 저작권과 지적 재산권도 보호받아야 한다는 입장. 독자 여러분은 어떤 입장인가요? 아래 링크를 통해 독자 여러분의 생각을 알려주세요. 오늘 마부뉴스가 준비한 편지는 여기까지입니다. 언제나처럼 긴 글 읽어줘서 고맙습니다! (*본 기사는 마부작침 뉴스레터를 편집한 기사입니다.)


마부작침 뉴스레터 구독하기 → https://page.stibee.com/sub/s!crip/ions/56136


신고

 
X