차지맨 켄!
접속 : 3738   Lv. 69

Category

Profile

Counter

  • 오늘 : 551 명
  • 전체 : 1577797 명
  • Mypi Ver. 0.3.1 β
[IT | 기술] (블룸버그) 딥시크, 천문학적 AI 개발 비용의 타당성에 의문 제기 (1) 2025/01/28 PM 02:32

중국 신생 기업이 ChatGPT와 경쟁하는 AI 모델을 극히 낮은 비용으로 제공하며 천문학적 AI 예산의 타당성에 의문을 제기  

 

 

img/25/01/28/194ab63c3592255ed.webp
딥시크(DeepSeek)가 월요일 글로벌 기술 주식을 뒤흔들었다.  

사진 제공: 안드레이 루다코프/블룸버그  



기자: 시린 가파리(Shirin Ghaffary)레이첼 메츠(Rachel Metz)  

2025년 1월 28일 오전 9시 25분 (GMT+9)  

2025년 1월 28일 오전 10시 42분 업데이트  


지난주, 세계 최대 인공지능 기업의 수장들이 스위스 알프스에 모였을 때, 모든 시선이 동쪽으로 향했다. 다보스 세계경제포럼(WEF) 현장에서 진행된 패널 토론 및 비공식 대화에서, 기술 경영진들은 미국 및 동맹국들이 데이터 센터를 더 많이 구축하고 규제와 경쟁 간의 균형을 맞춰 중국보다 앞서 나가야 한다고 강조했다.  


알파벳(Alphabet Inc.)의 사장 겸 최고투자책임자인 루스 포랏(Ruth Porat)은 이 행사에서 블룸버그 뉴스와의 인터뷰에서 이렇게 말했다.  

“우리는 모델에서 아마도 1년 이상의 우위를 점하고 있습니다.” 그러나 그녀는 이어서 “미국이 이 우위를 유지할 것이라고 보장할 수는 없습니다”라고 덧붙였다.  


그조차도 지나치게 낙관적이었을지 모른다. 같은 주에, 잘 알려지지 않은 중국 AI 스타트업인 딥시크(DeepSeek)가 인간의 사고 방식을 모방할 수 있는 새로운 오픈소스 AI 모델인 R1을 공개했다. 회사 측은 R1이 수학 작업 및 일반 지식과 같은 다양한 산업 벤치마크에서 미국 주요 개발자들과 동등하거나 그 이상으로 성능을 발휘했으며, 이를 극히 적은 비용으로 구축했다고 밝혔다.  


주말까지 딥시크는 AI 시스템에 대한 주요 순위표인 챗봇 아레나(Chatbot Arena)에서 순위를 급상승시켰으며, 마크 안드레센(Marc Andreessen)과 같은 기술계의 저명 인사들은 이 제품을 가리켜 “AI의 스푸트니크 순간”이라고 평가했다.  


img/25/01/28/194ab6450ea2255ed.webp
다보스에서 루스 포랏의 모습  

사진 제공: 스테판 웜무스/블룸버그  



이제 R1 출시의 여파가 미국 전역으로 빠르게 확산되고 있으며, 기술 업계는 딥시크(DeepSeek)가 어떻게 이러한 성과를 이뤄냈는지, 그리고 그들의 주장대로 정말로 저비용으로 달성했는지 이해하려 애쓰고 있다. 이미 일부에서는 이 중국 신생 기업이 서방 기술을 기반으로 챗봇을 개발하면서 대규모 언어 모델 개발에 드는 막대한 비용을 회피했을 것이라는 의혹이 제기되고 있다.  


샌프란시스코에서는 AI 경영진과 직원들이 딥시크의 기술을 긴급히 분석하고 있다. 익명을 전제로 사적인 문제를 논의하며 인터뷰에 응한 소식통에 따르면, OpenAI 직원들 중 일부는 딥시크가 어떻게 이런 모델을 출시할 수 있었는지를 정확히 파악하려 하고 있다. 또 다른 소식통은 OpenAI 내부에서 중국 기업들의 발전을 매우 심각하게 받아들여야 한다는 분위기가 형성되고 있으며, 이는 현재 모델을 개선하고 혁신할 수 있는 기회를 제공한다고 말했다.  


OpenAI의 최고경영자(CEO)인 샘 올트먼(Sam Altman)은 최근 직원들에게 이번 출시는 스타트업 OpenAI에게 있어 주요한 경쟁 지형 변화를 의미한다고 언급했다고 한 소식통은 전했다.  


img/25/01/28/194ab647a0f2255ed.webp
샘 올트먼 사진 제공: 앤드류 하닉/게티 이미지 


  

오픈소스 AI 모델에 집중하는 Meta Platforms Inc.는 딥시크(DeepSeek)가 어떻게 구축되었고 무엇을 할 수 있는지를 더 잘 이해하기 위해 내부 팀을 구성했다고 사안에 정통한 관계자들이 밝혔다. 이 회사는 OpenAI의 GPT-4 모델과 Google의 Gemini와 같은 주요 경쟁사를 평가하기 위해 유사한 태스크포스를 구성한 바 있다.  


딥시크는 거의 하룻밤 사이에 실리콘밸리 내부에서 AI 개발의 경제성과 최적의 기술 개발 방식, 그리고 미국이 중국 경쟁사들에 대해 어느 정도 우위를 점하고 있는지에 대한 많은 가정을 뒤집었다. 지난 2년여 동안 ChatGPT가 글로벌 AI 열풍을 시작한 이후, 업계는 더 나은 AI를 만들기 위한 길이 Nvidia Corp.와 같은 기업의 첨단 반도체에 대규모로 투자하고, 이를 수용할 점점 더 거대한 데이터 센터를 구축하는 데 달려 있다고 믿어왔다.  


img/25/01/28/194ab64b6db2255ed.png
기술 기업들은 이미 AI 인프라에 수십억 달러 투자 중  

데이터 센터 구축 열풍으로 투자 금액 급증  



미국의 도널드 트럼프 전 대통령은 이 개발을 두고 “좋은 일입니다. 왜냐하면 그렇게 많은 돈을 쓸 필요가 없기 때문입니다”라고 환영했다. 딥시크의 데뷔로 주가에 큰 타격을 입은 업계 리더 Nvidia는 월요일 성명을 통해 이를 “훌륭한 AI 발전”이라고 칭송하기도 했다.  


중국 회사에서 나온 딥시크 AI의 출시는 우리 산업계에 경종을 울리는 계기가 되어야 합니다. 우리가 경쟁에서 승리하기 위해 초집중해야 할 필요성을 보여줍니다.” 트럼프 전 대통령은 덧붙였다.  


딥시크로 인한 시장 충격, 엄청난 규모로 발생  


딥시크(DeepSeek)의 성과에 대한 과열된 기대감은 월요일 미국과 유럽 기술주에서 약 1조 달러에 가까운 폭락을 초래하며 투자자들이 미국 대기업들의 지출 계획에 의문을 제기하게 만들었다. AI 칩 제조업체 Nvidia의 주가 급락만으로도 약 5,890억 달러의 시장 가치를 잃었으며, 이는 미국 주식 시장 역사상 최대 규모의 손실이다.  


한편 워싱턴 DC에서는, 중국의 군사 및 경제에 핵심적이라고 여기지는 인공지능 기술에서 중국의 진전을 저지하기 위한 최적의 방법을 모색해야 하는 상황에 놓였다. 바이든 행정부의 반도체 수출 규제가 충분하지 않았다는 점에서 더욱 그렇다. 도널드 트럼프 전 대통령의 암호화폐 및 AI 담당 책임자인 데이비드 삭스(David Sacks)는 딥시크가 글로벌 AI 경쟁이 매우 치열할 것임을 보여준다며, 바이든 행정부의 규제가 AI 개발을 "방해했다"고 비난했다.  


한편 상황을 더욱 복잡하게 만드는 것은, 대규모 AI 투자에 대한 새로운 불확실성이 트럼프가 OpenAI, 소프트뱅크 그룹, 오라클이 참여하는 1,000억 달러 규모의 합작 투자를 지지한다고 밝힌 지 며칠 만에 발생했다는 점이다이 합작 투자는 데이터 센터와 같은 물리적 인프라에 투자하여 미국의 경쟁력을 강화하기 위한 것이었다. 하지만 이제 천문학적 AI 예산의 타당성에 대해 새로운 의문이 제기되고 있다

 

“이건 패러다임의 전환입니다.” 데이터브릭스(Databricks Inc.)의 CEO 알리 고드시(Ali Ghodsi)는 말했다. “이처럼 저렴하게 생산할 수 있는 추론 능력을 가진 모델들은 민주화될 것이며, 세계의 예상치 못한 구석에서 혁신이 나타나게 될 것입니다.”


딥시크의 부상  


량원펑(Liang Wenfeng)에게 딥시크(DeepSeek)는 부업으로 시작된 프로젝트였다. 올해 40세인 량은 2023년 자신의 헤지펀드인 저장 하이플라이어 자산운용(Zhejiang High-Flyer Asset Management)의 AI 부서에서 파생된 프로젝트로 딥시크를 설립했다.  


량은 현지 인재와 무엇보다도 칩을 효과적으로 활용할 수 있었다. 그는 미국이 수출 규제를 시행하기 전에 AI 시스템 훈련에 필수적인 핵심 기술인 Nvidia A100 GPU 약 10,000개를 사재기하기 시작했다. 또한, 그의 주요 연구원 대부분은 중국의 최고 대학들을 갓 졸업한 인재들로 구성되었다고 량은 밝혔다. 그는 중국이 자체적인 국내 생태계를 발전시켜야 할 필요성을 강조했다.  


딥시크는 2023년 말에 처음으로 딥시크 LLM(대규모 언어 모델)을 시작으로 여러 오픈소스 AI 모델을 신속히 출시했다. 이후 2024년 중반과 말에 각각 더 발전된 두 가지 모델(V2와 V3)을 선보였다. 하지만 진정으로 주목받은 것은 1월 중순에 출시된 딥시크의 R1 모델이었다.  


img/25/01/28/194ab6523222255ed.jpg
딥시크, AI 모델 경쟁사 중 3위에 오르다  

커뮤니티 평가를 통해 선정된 상위 5개 기업의 최고 모델 순위  



딥시크 R1 모델은 뛰어난 성능과 비용 효율성으로 인해 세계 기술 커뮤니티에서 폭발적인 반응을 얻었고, 딥시크를 전 세계적으로 중요한 AI 경쟁자로 자리 잡게 했다.


딥시크 R1, 경쟁 모델과의 차별화된 효율성  


OpenAI, Google, Anthropic의 최신 모델들과 마찬가지로, 딥시크(DeepSeek)의 R1 모델은 사용자의 질문에 답하기 전에 문제를 깊이 고민하며 시간을 들여 계산하는 방식으로 인간의 사고 과정을 모방하도록 설계되었다. 하지만 딥시크의 버전은 그 효율성에서 차별화된다. 딥시크 팀은 자신들이 보유한 컴퓨터 칩을 최대한 활용할 수 있는 간단하지만 핵심적인 혁신을 고안했다. 또 다른 돌파구는 강화 학습(reinforcement learning) 기술에 크게 의존한 것이다. 이 기술은 시스템이 올바른 답을 제공하면 보상을 주고, 잘못된 답을 제공하면 패널티를 부여하는 방식으로 작동한다.  


딥시크의 앱은 특히 미국 사용자들 사이에서 인기를 끌었다. 그 이유 중 하나는 친근하면서도 약간 어색한 말투의 챗봇 덕분이다. 이 챗봇은 질문에 답하기 전에 문제에 대한 자신의 계획을 매우 상세하게 설명해 준다. 이 접근 방식은 예를 들어 OpenAI의 최신 추론 모델보다 훨씬 더 많은 세부 정보를 포함한다. 게다가 OpenAI가 가장 고급 추론 모델에 무제한으로 액세스할 수 있는 옵션을 포함하여 월 최대 $200의 요금을 부과하는 것과 달리, 딥시크는 현재 이 서비스를 무료로 제공하고 있다. 그러나 딥시크는 중국 내 민감한 주제에 대해 검열을 한다. 예를 들어, 중국 문화대혁명에 대해 묻는다면 “죄송합니다. 현재 제 범위를 벗어난 주제입니다. 다른 주제로 이야기해 봅시다.”라는 답변을 받을 수 있다.  


R1 모델 출시 후 한 시간도 지나지 않아, 데이터브릭스(DataBricks)의 CEO 알리 고드시(Ali Ghodsi)는 첫 번째 고객으로부터 R1을 활용할 방법에 대한 문의를 받았다고 전했다. 이후로 수요는 더욱 급증했다. 특히 기업들은 딥시크의 추론 능력을 데이터브릭스의 기존 AI 모델 위에 추가하는 방법에 대해 알고 싶어 한다고 그는 말했다. 딥시크의 사례는 이러한 작업이 저비용으로 가능함을 보여준다고 덧붙였다.  


“이 정도의 속도와 관심 수준은 우리에게도 전례 없는 일입니다.” 고드시는 말했다.  


img/25/01/28/194ab6568af2255ed.webp
딥시크의 효율성은 경쟁사와 차별화된다. 사진 제공: 안드레이 루다코프/블룸버그  



소프트웨어 회사 오픈리플레이(OpenReplay)의 CEO 메흐디 오스만(Mehdi Osman)은 자신의 회사가 전통적으로 OpenAI, Anthropic, Mistral의 서비스를 사용해 왔으며, 딥시크(DeepSeek)의 추론 능력이 OpenAI와 동등해 보인다고 말했다. “만약 OpenAI가 가격을 낮추지 않는다면, 많은 개발자가 앞으로 몇 달 안에 딥시크로 옮겨갈 것이라고 생각합니다.”라고 오스만은 전했다.  


OpenAI는 논평을 거부했으며, 딥시크는 논평 요청에 응답하지 않았다.  


갑작스러운 등장입니다.” 구글 딥마인드(Google DeepMind)의 CEO 데미스 허사비스(Demis Hassabis)는 다보스에서 블룸버그와의 인터뷰에서 말했다. “이 시스템이 인상적이라는 점은 의심의 여지가 없습니다.” 그러나 다른 업계 전문가들처럼 허사비스는 딥시크 모델의 작동 방식, 특히 서구 모델에 얼마나 의존했는지에 대해 불확실성을 나타냈다.  


최근 OpenAI를 떠난 독립 AI 정책 연구원인 마일스 브런디지는 "설령 그들이 (OpenAI 모델을 증류하는 것으로) 약간의 시간과 비용을 절약했다 하더라도 - 물론 그들이 그렇게 했다고 말하는 것은 아니지만 - 논문에는 사람들이 직접 살펴보고 판단할 수 있는 진정한 기술적 작업이 분명히 많이 포함되어 있다"고 말했습니다.


한편, OpenAI의 샘 올트먼(Sam Altman)은 딥시크의 성능이 OpenAI 모델을 증류(distilling)한 결과인지, 즉 OpenAI의 AI 출력을 사용해 비슷한 능력을 가진 다른 모델을 훈련시킨 것인지, 아니면 독립적인 연구 돌파구의 결과인지를 이해하려 하고 있다고 OpenAI 내부 관계자가 전했다.  


최근 OpenAI를 떠난 독립 AI 정책 연구원인 마일스 브런디지(Miles Brundage)는 "설령 그들이 (OpenAI 모델을 증류하는 것으로) 약간의 시간과 비용을 절약했다 하더라도 - 물론 그들이 그렇게 했다고 말하는 것은 아니지만 - 논문에는 사람들이 직접 살펴보고 판단할 수 있는 진정한 기술적 작업이 분명히 많이 포함되어 있다"고 말했다.

딥시크 기술 비용에 대한 의구심  


몇몇 미국 기술 창업자와 벤처 자본가들 역시 딥시크 기술의 실제 비용에 대해 회의적인 태도를 보이고 있다. 브런디지를 포함한 많은 이들은 딥시크가 발표한 560만 달러의 훈련 비용 추정치가 기존 연구 실험의 비용이나 데이터 센터 구축과 같은 GPU 투자에 따른 고정 비용을 포함했는지 의문을 제기했다.  


량원펑(Liang Wenfeng)은 비용과 자금 조달이 자신의 주요 관심사가 아니라고 주장했다. 중국 매체 36kr과의 인터뷰에서 량은 추가 발전의 병목 요인은 미국의 최첨단 칩에 대한 접근 제한이라고 밝혔다.  


더 많은 투자가 반드시 더 많은 혁신으로 이어지지는 않습니다.” 량은 말했다. “그렇지 않다면 대기업들이 모든 혁신을 독점했을 것입니다.” 

 

새로운 경쟁 환경  


딥시크(DeepSeek) 열풍이 일어나기 몇 주 전, 량원펑(Liang Wenfeng)이 언급했을 가능성이 있는 대형 기업들은 재정적 여력을 더욱 과시했다.  


아마존(Amazon)은 2024년에 약 750억 달러를 자본 지출로 사용할 계획을 발표했으며, 올해는 이보다 더 많은 금액을 기술 인프라에 투자할 것이라고 밝혔다. 여기에는 인공지능을 구동하는 칩과 데이터 센터가 포함된다. 메타(Meta)는 2025년에 AI 관련 프로젝트에 최대 650억 달러를 투자할 것이라고 밝혔고, 마이크로소프트(Microsoft)는 이번 회계연도에 AI 데이터 센터에 800억 달러를 지출할 것이라고 발표했다.  


대형 클라우드 컴퓨팅 기업들의 지출 대부분은 엔비디아(Nvidia)의 그래픽 처리 장치(GPU)로 향하고 있다. 아마존, 구글, 마이크로소프트는 또한 AI를 위해 설계된 맞춤형 칩을 제작하고 있는데, BNP 파리바 엑스안(BNP Paribas Exane)의 분석가 스테판 슬로윈스키(Stefan Slowinski)는 월요일 연구 노트에서, 만약 개발자들이 덜 특수화된 하드웨어에서도 모델을 구축하고 실행할 수 있게 된다면 이러한 작업이 장기적으로 덜 유용할 수 있다고 지적했다.  


클라우드 대기업들은 이미 막대한 AI 투자로부터 얻을 수익성에 대한 투자자들의 의문에 직면해 있다. 예를 들어, 마이크로소프트는 제품 라인의 상당 부분에 통합한 코파일럿(Copilot) 챗봇을 수익화하는 데 어려움을 겪고 있다. 한편, 아마존은 자사의 리테일 및 클라우드 컴퓨팅 사업에 챗봇 및 기타 AI 도구를 도입하면서도, 자체 대규모 언어 모델 개발에서는 주요 경쟁사들에 뒤처지고 있다.  


img/25/01/28/194ab65c9d12255ed.webp
아마존 엔지니어들은 오스틴에 있는 아나푸르나 랩스(Annapurna Labs)에서 인공지능 칩 개발에 매진하고 있다. 

사진 제공: 세르지오 플로레스/블룸버그  



그럼에도 불구하고 두 기업의 막대한 투자는 장기적으로 결실을 맺을 가능성이 있다.  


아마존은 최대 클라우드 컴퓨팅 서비스 제공자로서의 지위를 활용해, 다른 회사들이 아마존 웹 서비스(AWS) 서버에서 AI 프로그램을 훈련하고 실행함으로써 이익을 얻을 수 있을 것이라고 기대하고 있다. 마이크로소프트는 AI 모델을 훈련시키는 것보다는 실행하는 데이터 센터 구축에 더 집중하고 있다고 베른슈타인 소시에테 제네랄 그룹(Bernstein Société Générale Group)의 애널리스트 마크 머들러(Mark Moerdler)가 전했다. 그는 마이크로소프트의 지출이 이르면 내년부터 둔화될 것으로 예상하며, “우리는 마이크로소프트가 주로 추론(inferencing) 용량을 구축하고 있으며, 훈련(training)에는 집중하지 않는다고 보고 있습니다.”라고 말했다. “만약 이 분석이 맞다면, 딥시크(DeepSeek)는 마이크로소프트에 큰 문제가 되지 않을 것입니다.”  


핵심 질문은 미국의 대형 기술 기업들이 딥시크의 접근 방식을 어느 정도 채택할지 여부이다.  


일부 AI 개발자들은 중국의 신생 기업 딥시크의 성공이 저렴하고 더 수익성 높은 AI로의 전환을 가속화할 수 있다고 말한다. 이는 칩에서 스마트폰에 이르기까지 거의 모든 주요 기술 개발을 추진해 온 자연스러운 진화를 촉진할 가능성이 있다.  


AI 스타트업 코히어(Cohere)의 CEO 에이든 고메즈(Aidan Gomez)는 이렇게 말했다.대규모 언어 모델(LLM)의 미래는 더 많은 컴퓨팅 자원에 의존하는 것이 아니라, 더 효율적인 기술에 집중하는 사람들에게 달려 있습니다. 우리는 오래전부터 이 사실을 믿어왔지만, 이제 업계 전반에서 이를 실감하고 있습니다.”



#DeepSeek #오픈소스 

신고

 

하프라이프/    친구신청

특이점 코앞
X