미국의 과학소설 작가인 테드 창이 인공지능 서비스 챗GPT에 대해 “인터넷 정보의 복제열화판에 불과하다”고 주장해 파문이 일고 있다. 그는 소설「네 인생의 이야기」가 영화〈컨택트〉로 제작돼 전 세계에서 개봉하는 등 국내에서도 인지도가 높은 인물이다.
지난 9일(현지 시각) 창은 미국 매체 더 뉴요커에 기고한 글을 통해 “챗GPT는 인터넷에 돌아다니는 글을 복제해 열화한 것(ChatGPT Is a Blurry JPEG of the Web)”이라고 주장했다. 그는 “과거 제록스 복사기는 원본 문서를 압축하여 저장하는 과정에서 일부 글자가 변조되는 경우가 있었다”며 “챗GPT도 인터넷상 글을 1% 수준으로 압축해 나머지 부분은 추정해서 채워 넣은 것”이라고 했다.
창은 챗GPT가 인터넷의 글을 그대로 따라 하기만 할 뿐, 그 안에 들어있는 맥락과 원리를 전혀 이해하지 못한다고 지적했다. 예컨대 3+5 같은 쉬운 계산은 이미 인터넷상에 예제가 많기 때문에 쉽게 답할 수 있지만, 덧셈의 원리를 이해하지 못하기 때문에 245+821 같이 자릿수가 많아지고 예제가 적으면 부정확한 답을 내놓는다는 것이다. 그는 “(챗GPT와 같은) 언어 모델은 통계적 규칙성을 식별해 동작한다”며 “가령 인터넷의 글을 분석해 ‘공급이 부족하다’와 같은 문구가 ‘물가 상승’과 함께 자주 나타나면 두 용어 사이의 상관관계가 있다고 판단하는 것”이라고 설명했다.
챗GPT가 널리 쓰이게 될 경우 생길 부작용에 대해서도 창은 우려했다. 틀린 정보를 그럴듯하게 설명하고, 인공지능이 생성한 거짓 정보가 인터넷을 가득 채울 수도 있다는 것이다. 그는 “대규모 언어 모델에 의해 생성된 텍스트가 웹에 더 많이 게시될수록 온라인에서 원하는 정보를 찾기가 더 어려워질 것”이라고 전망했다. 또 그는 “챗GPT의 다음 버전을 낼 때는 인공지능이 생성한 글을 학습 대상에서 제외하려 노력할 것”이라 꼬집기도 했다.
끝으로 창은 챗GPT가 인간의 독창적인 글쓰기도 불가능하게 만들 것이라 비판했다. 인공지능 서비스를 갖고는 독창적인 아이디어를 발현해낼 수 없을 뿐만 아니라, 스스로 글을 쓰는 과정에서 얻게 떠오르게 되는 새로운 아이디어를 접할 기회조차 잃기 때문이다. 그는 “챗GPT의 도움을 받아 글을 쓰는 것은 마치 복사기를 갖고 예술 작품을 만드는 것이나 마찬가지”라고 했다.
이러한 창의 의견에 대해 딥마인드의 선임연구원인 앤드루 람피넨은 “(챗GPT 같은) 인공지능이 단순히 글을 암기해 재구성하기만 한다는 것은 오해에 불과하다”며 “충분한 수준의 학습을 거치면 그보다 더 많은 일을 해낼 수 있다”고 반박하기도 했다.
"I think there’s a simpler explanation. Imagine what it would look like if ChatGPT were a lossless algorithm. If that were the case, it would always answer questions by providing a verbatim quote from a relevant Web page. We would probably regard the software as only a slight improvement over a conventional search engine, and be less impressed by it. The fact that ChatGPT rephrases material from the Web instead of quoting it word for word makes it seem like a student expressing ideas in her own words, rather than simply regurgitating what she’s read; it creates the illusion that ChatGPT understands the material. In human students, rote memorization isn’t an indicator of genuine learning, so ChatGPT’s inability to produce exact quotes from Web pages is precisely what makes us think that it has learned something. When we’re dealing with sequences of words, lossy compression looks smarter than lossless compression."
verbatim
말(글자) 그대로(의) (=word for word)
rote
(기계적인 반복에 의한) 암기
regurgitate
① (삼킨 음식물을 입 안으로 다시) 역류시키다
② (듣거나 읽은 내용을 별 생각 없이) 반복하다
rephrase
(뜻을 더 분명히 하기 위해) 바꾸어 말하다