엔비디아, 자체 설계 올림푸스 코어 기반 ‘베라 CPU’ 성능 공개
2026-05-27
젠슨 황 엔비디아 창립자 겸 CEO는 6일(현지시간) 미국 라스베이거스에서 열린 CES 2026을 맞이해 퐁텐블로 호텔에서 Q&A 세션을 마련하고 차세대 AI 플랫폼 ‘베라 루빈(Vera Rubin)’의 구체적인 성능 지표를 공개하며, 또 한 번의 기술 퀀텀 점프를 선언했다. [사진=김문기 기자]
[디지털데일리 김문기기자] 엔비디아가 자사 최초로 아키텍처를 자체 설계한 암(Arm) 기반 서버용 중앙처리장치 ‘베라’의 독립 성능 지표를 공개했다.
26일(현지시간) 테크 전문 매체 포로닉스(Phoronix) 등 복수 외신에 따르면 엔비디아(Nvidia)가 자사 최초로 아키텍처를 자체 설계한 암(Arm) 기반 서버용 중앙처리장치(CPU) ‘베라(Vera)’의 첫 번째 독립 벤치마크 결과를 공개했다.
베라 CPU는 암 명령어 집합 구조(ISA)를 기반으로 엔비디아가 직접 설계한 첫 순수 독자 CPU로, 타사 지식재산권(IP)을 라이선스해 사용했던 기존 그레이스(Grace) CPU와 달리 독자적인 고성능 전용 아키텍처 ‘올림푸스(Olympus)’ 코어를 채택했다.
88코어 176스레드 구성을 갖춘 이 제품은 기하평균 성능 기준 경쟁사인 AMD의 에픽(EPYC) 서버 칩을 10% 차이로 제쳤으며, 인텔(Intel)의 플래그십 제온(Xeon) CPU 대비 55% 이상의 성능 우위를 기록했다.
이번 테스트는 코드 컴파일, 파이썬(Python) 성능, 오픈JDK 자바 워크로드 등 데이터센터 관점에 초점을 맞춘 엔비디아의 지정 워크로드 가이드라인에 따라 제한적으로 수행됐다.
기술 분석 결과 베라 CPU는 초당 1.2테라바이트(TB/s)에 달하는 LPDDR5X 기반 메모리 대역폭을 확보해 기존 x86 아키텍처 기반 프로세서 대비 코어당 최대 4배의 메모리 전송 능력을 달성했다. 이는 다중 다이 배치에 따른 칩릿 구조의 고질적인 지연 시간 문제를 모놀리식(monolithic) 단일 다이 설계와 2세대 확장형 일관성 패브릭(SCF) 인프라로 극복했기 때문으로 분석된다.
특히 대용량 데이터 환경을 겨냥한 전용 가속 설계로 파일 압축과 동영상 인코딩 등 일부 컨슈머 지표에서도 경쟁 모델을 무력화하는 성과를 냈다. 암페어 컴퓨팅(Ampere Computing)이나 구글 컴퓨트 엔진(Google Compute Engine), 마이크로소프트 애저(Microsoft Azure)의 자체 커스텀 암 칩들과 비교해도 월등한 데이터 처리 효율성을 보여줬다.
엔비디아가 이처럼 독자적인 고성능 CPU 코어 개발에 사활을 건 배경은 급변하는 에이전트(Agentic) AI 및 자율 추론 시장의 주도권을 장악하기 위함이다. 그래픽처리장치(GPU) 성능이 베라 루빈(Vera Rubin) 플랫폼 등으로 진화함에 따라 순차 제어와 조율을 담당하는 CPU의 연산 병목 현상이 심화되자, 엔비디아는 오픈AI(OpenAI), 스페이스X(SpaceX), 안트로픽(Anthropic), 오라클(Oracle) 등 글로벌 테크 리더들에게 베라 CPU 랙을 직접 인도하며 독자적인 에코시스템 확장에 속도를 내고 있다.
다만 이번 성능 지표가 엔비디아가 선정한 특정 테스트 환경에서만 도출됐다는 점과 소비 전력 대비 효율성 데이터의 미공개는 숙제로 남았다. 현재 엔비디아가 PC 시장 진입을 위해 준비 중인 차세대 ‘N1x’ 칩의 경우 올림푸스 코어가 아닌 기성품 Arm 코어를 활용하는 것으로 알려져 컨슈머 시장으로의 즉각적인 아키텍처 이식은 제한적일 전망이다.



