컴퓨터의 산술 연산은 정수 연산(Integer)과 부동소수점(Floating Point) 연산으로 나뉜다. 정수 연산은 단순한 사칙연산 등으로, 컴퓨터 프로그램을 구동하는데 기본적으로 필요하다. 정수 연산은 중앙 처리 장치(CPU)가 담당하는데, 이는 CPU가 보다 논리적이고 복잡하게 얽힌 작업을 수행하는데 최적화된 구조로 돼있어서다. 반대로 부동소수점 연산은 그래픽 처리 장치(GPU)가 맡는다. GPU는 다수의 데이터를 병렬로 처리하는 구조여서 대규모 데이터 및 복잡한 계산을 효율적으로 처리한다. 그래서 인공지능 개발 작업에 CPU가 아닌 GPU가 사용되는 것이다.
이러한 공식에 따라 현재 업계는 크게 두 갈래로 나뉘어있다. CPU는 인텔과 AMD가 양분하고 있고, GPU는 엔비디아가 절대다수를 차지하며 AMD가 일부 지분을 갖고 있다. 기업 규모나 시장 측면으로 볼 때 충분히 인텔과 AMD, 엔비디아가 삼자 경쟁을 할 법 하지만, CPU와 GPU의 구조적 차이와 서로 다른 활용도 때문에 직접 경쟁이 이뤄지지는 않아 왔다. 하지만 엔비디아가 올해 6월 Arm 기반 CPU를 탑재한 ‘그레이스호퍼’ 슈퍼칩으로 인텔을 대체할 가능성을 확인하고, Arm 기반 PC용 CPU가 수면위로 떠오르며 새로운 국면을 맞고 있다.
엔비디아, CPU 자체 제작으로 시장 공략 준비
GPU는 강력한 부동소수점 연산 성능을 통해 금융, 과학, 설계, 그래픽 처리 등의 분야에도 쓰이고 있다 / 출처=엔비디아
올해 IT 시장의 화두는 인공지능이다. 소프트웨어 업계에서는 생성형 AI와 대형언어모델을 비롯한 기술이 대두되고 있고, 하드웨어 업계에서는 이를 보조할 AI 가속기, 처리 장치가 주목받고 있다. 이 시기가 올 것을 예상하고 준비한 대표적인 기업이 엔비디아다. 엔비디아는 07년부터 서버용 부동소수점 처리 카드인 엔비디아 테슬라 라인업을 구축해 왔고, 꾸준히 슈퍼컴퓨터와 데이터센터 등에 납품해왔다. 그러다 GPT를 비롯한 생성형 AI발 그래픽 카드 수요가 폭발하며 극적인 호황을 누리는 상황이다.
하지만 서버용 시스템을 납품할 때에도 CPU가 포함돼야하고, 인텔과 AMD가 반사 이익을 얻는 게 보통이다. 그래서 엔비디아는 지난 6월 컴퓨텍스에서 ‘그레이스호퍼’ 슈퍼칩을 발표하면서 사실상 CPU까지 대체하겠다는 계획을 공개한다. 그레이스호퍼는 Arm의 그레이스 CPU와 엔비디아의 호퍼 GPU를 합친 완제품이어서 인텔과 AMD의 개입을 줄이게 된다.
그리고 지난 10월 23일에는 엔비디아가 인텔 CPU를 대체하기 위한 Arm 기반 PC 칩 제작에 나섰다는 보도가 나왔다. 로이터에 따르면, 엔비디아는 Arm 기술을 바탕으로 윈도우 PC 등에 사용할 수 있는 CPU 설계를 시작했다. 최근 엔비디아 이외에도 퀄컴이나 마이크로소프트, AMD까지 Arm 기반의 윈도우 PC용 프로세서 제작에 나선 것으로 알려졌는데, 엔비디아가 PC 프로세서까지 만들면 인텔과 엔비디아가 CPU로 경쟁하는 새로운 구도가 성립된다.
시장조사기관 카운터포인트리서치는 올해 Arm 기반 노트북 점유율이 15%를 기록할 수 있으며, 2027년에는 최대 25%까지 오를 수 있다고 밝혔다. 대다수는 애플 실리콘 기반의 판매량이지만, 엔비디아나 다른 기업들도 Arm 기반 제품을 출하하면 점유율은 더 올라갈 수 있다. 장기적으로는 서버용 프로세서까지도 엔비디아가 노려볼 상황이 된다.
인텔, 서버용 GPU를 CPU로 대체하는 기술로 맞불
한편 엔비디아와 거리를 두고 있던 인텔도 엔비디아의 영역에 도전장을 내밀었다. 지난 31일, 인텔이 네이버와 함께 GPU 기반 인공지능용 모델 서버를 2세대 인텔 제온 스케일러블 프로세서 서버로 전환하는 데 성공했다. 대체된 서비스는 네이버 지도의 ‘네이버 플레이스’ 관련 정보 중 영수증, 음식 사진, 공간 사진 등의 이미지를 인식 판별 및 매칭, 상점 정보, 사용후기 판별 및 검색결과 노출에 대해 학습하고 추론하는 인공지능이다.
네이버 지도에서 검색하면 나오는 메뉴가 네이버 플레이스다 / 출처=네이버
전환 배경은 네이버 G플레이스 AI 개발팀이 최근 GPU 기반 서버의 비용 증가 및 가용성 제한을 겪었고, 이를 해소하기 위해 GPU 기반 서버에서 수행하던 추론 과정을 CPU 기반 서버로 전환할 계획을 세운 것이다. 전 세계적으로 인공지능용 GPU 수요가 폭증하면서 전반적인 가격대가 크게 오르고, 대기까지 걸어야 하는 상황이라서다.
보통 GPU 서버를 CPU로 단순 전환할 경우 성능이 크게 낮아지는데, 네이버 G플레이스 개발팀은 신경망 추론에 최적화된 인텔 파이토치 확장팩을 도입해 병목 현상을 줄이고, CPU 코어 활용을 늘려 초당 처리 개수를 7배까지 끌어올렸다. 또 지연시간을 줄이기 위해 모델을 개선해 음식 사진 분류가 33배, 이미지 점수가 30배, 영수증 분류 성능이 5.5배 향상됐다. 이후 약 한 달간 사전 검증을 거친 뒤 GPU 기반 서버 사용을 줄여 연간 약 4억 원 이상의 운용 비용을 절감하게 됐다.
네이버는 2세대 인텔 제온 스케일러블 프로세서로 서버를 전환했고, 현재 4세대 프로세서를 활용한 테스트를 진행하고 있다 / 출처=인텔
이번 사례는 CPU 기반 서버로도 엔비디아의 GPU 서버를 대체할 수 있음을 증명했다는 데 의미가 있고, 또 GPU 기반 서버 마련 및 운용에 어려움을 겪는 기업에 대체제가 될 수 있음을 보여줬다. 게다가 인텔은 CPU 이외에도 인공지능 전용 가속기인 하바나 가우디 2, 데이터센터 GPU 맥스 등 엔비디아의 GPU와 직접 경쟁이 가능한 품목들도 갖추고 있어서 장기적으로 엔비디아의 최대 경쟁사로 떠오를 가능성도 있다.
경계 무너지는 인공지능 하드웨어, 성능과 확장성이 관건
엔비디아는 인텔이 수십 년 간 갖고 있던 CPU 시장에 진입할 구상을 짜기 시작했고, 인텔도 엔비디아의 독주 체제를 무너뜨릴 해법을 계속 준비하고 있다. AMD 역시 CPU와 GPU 모두 출시하며 양쪽 모두를 견제하는 상황이다. 이대로라면 Arm 기반 PC가 시장에 자리잡는 2025년쯤이면 인텔과 엔비디아, AMD가 삼자 경쟁을 벌이는 상황이 될 가능성이 크다. 서버 시장 규모 자체가 크긴 하지만, 점유율 측면에서는 제로섬 게임이니 경쟁은 치열할 것이다.
퀄컴은 지난달 개최된 스냅드래곤 서밋 2023에서 Arm 기반으로 자체 설계한 퀄컴 오라이온 CPU를 공개했다 / 출처=퀄컴 테크날러지
그리고 어떤 기술이 됐든 성능보다도 호환성이 핵심이 될 전망이다. 퀄컴이 지난 2018년 출시한 스냅드래곤 컴퓨트 플랫폼의 경우, 낮은 발열과 적절한 효율로 기대를 모았지만, x86 전용 웹사이트나 애플리케이션을 지원하지 않는 등의 문제로 큰 주목을 받지 못했다. 다만 퀄컴은 21년에 미국 반도체 스타트업 누비아를 인수하는 등 컴퓨터 시장 진입을 위해 노력해온 터라 새로 출시한 퀄컴 오라이온 CPU는 과거와 다른 결과를 보여줄 것이다. 애플 실리콘으로 Arm 기반 PC 시장이 기지개를 펴고, 퀄컴을 비롯한 기업들이 힘을 모으기 시작하는 게 지금의 상황이다.
엔비디아도 이 흐름을 타는 것인데, 앞서 퀄컴의 사례처럼 확장성 문제가 발목이 잡힌다면 인텔을 잡기는커녕 자충수가 될 수 있다. 반대로 인텔 역시 GPU를 CPU로 대체하는 과정에서 호환성이 떨어진다면 단순 사례로 그치고 말 것이다. 얼마나 잘 지원하는가, 그것이 향후 시장의 향방을 결정짓는 요소다.