AI 칩이 뭐길래? AI 반도체 둘러싼 빅테크들의 전쟁
딜로이트 인사이트(Deloitte Insights)에 따르면, 2027년 인공지능(AI) 반도체 시장 규모는 4,000억 달러 규모에 이를 전망이다. 최근 딥러닝(DL), 신경망과 같은 AI 알고리즘이 지속적으로 발전함에 따라, AI 반도체의 성능도 향상되고 있으며, 이에 따라 전 세계 빅테크 기업들도 AI 반도체 전쟁에 뛰어들고 있다. AI 반도체 생태계 현황을 살펴보자.

지난주 미국 라스베이거스에서 개최된 세계 최대 IT전시회인 CES 2025에서 가장 돋보였던 주인공은 단연 엔비디아(NVIDIA)였다. CES의 시작을 알리는 기조연설도 젠슨 황 엔비디아 CEO가 맡았다. 이번 행사에서 젠슨 황은 물리적 AI 개발 플랫폼 '코스모스(Cosmos)', 개인용 AI 슈퍼컴퓨터 '프로젝트 디지트(DIGIT)', 게임용 그래픽처리장치(GPU) 업그레이드 버전인 GPU 지포스 'RTX 50' 시리즈 등 신제품들을 공개했다.
AI 반도체의 개념
컴퓨팅 환경은 급속도로 변화하고 있다. 텍스트가 대세였던 과거와는 달리, 지금은 이미지와 영상이 넘쳐나고 있다. 따라서 기존 방식으로 대용량 데이터를 수집하고 실시간으로 처리하기에는 한계가 있다. 이 문제를 해결하기 위해 AI 반도체가 등장했다.
기존의 반도체가 AI 데이터를 처리할 수 없는 것은 아니다. 익히 알고 있는 CPU(Central Processing Unit)와 그래픽 연산을 처리하는 GPU(Graphics Processing Unit)도 AI 데이터를 처리할 수 있다. 기존 CPU는 하나의 칩에 연산 장치와 해독 장치, 제어 장치 등이 집적돼 있어 사용자로부터 입력 받은 명령어를 해석하고 연산한 후 그 결과를 출력한다.
CPU보다 한 단계 발전된 GPU는 연산 결과를 그림이나 글자 신호로 변환해 모니터에 출력하는 기능을 한다. 예를 들어, 게임에 입체감을 부여하기 위한 3D 그래픽 처리, 화면을 보다 현실적으로 만들기 위한 각종 광원 효과 및 질감 표현 등을 처리한다.
효율적인 AI 데이터 처리를 위해서는 AI 데이터 만을 전문적으로 연산하는 반도체가 필요하다. 이것이 바로 AI 반도체인 NPU(Neural Processing Unit)가 등장한 이유이다. 우리 몸의 신경계는 신체의 자극을 받아들여 뇌에 전달하고 적절한 판단을 통해 반응 신호를 보내는데, 이때 뇌는 받아들인 자극을 종합적으로 판단하고 최종 명령을 내린다. 사람의 두뇌처럼 데이터를 학습하고 처리하는 반도체를 ‘NPU’라고 한다.
NPU는 동시다발적인 행렬 연산에 최적화된 처리 장치로 여러 개의 연산을 실시간으로 처리한다. 또한, 스스로 학습해 축적된 데이터를 기반으로 최적의 값을 도출한다. 이런 특징 덕분에 NPU는 컴퓨터가 인간의 두뇌처럼 스스로 학습할 수 있는 기계학습에 최적화된 반도체로 평가받고 있다.
AI 반도체는 크게 GPU, NPU, TPU(Tensor Processing Unit) 등으로 구분할 수 있다. TPU는 구글이 개발한 AI 가속기로, 특정 AI 모델에 최적화된 성능을 제공한다. 또 다른 AI 반도체로는 PIM(Process In Memory)이 있다. PIM은 메모리 반도체와 연산을 처리하는 시스템 반도체(CPU, GPU 등)를 합쳐 메모리 내에서 직접 연산을 처리할 수 있다. 따라서 PIM 하나만으로도 AI 연산 처리용 프로세서 SoC(System On Chip)와 이에 필요한 데이터를 저장하는 메모리 반도체가 하나의 칩에서 동시에 동작한다.
AI 반도체 기술 개발에 올인하는 글로벌 빅테크
엔비디아는 AI 반도체를 주도하고 있다. 최근 빅테크 기업들이 GPU나 개선된 성능의 NPU 등을 선보이고 있지만, 아직까지 엔비디아에 대적할 제품은 나타나지 않았다. 엔비디아는 기업이 요구하는 조건을 충족하는 맞춤형 칩 개발까지 영역을 넓히고 있다. 엔비디아는 칩 시장에서의 점유율 확대를 위해 아마존, 메타, 마이크로소프트, 구글, 오픈AI 등 주요 기업들과 접촉하고 있다.
글로벌 IT기업들은 자사 데이터센터의 서비스 안정화를 위해 자체 AI 반도체 개발에 나서고 있다. 메타와 구글, 아마존과 마이크로소프트는 엔비디아 AI 반도체에 의존을 낮추고, 폭증하는 방대한 데이터를 실시간으로 빠르게 처리하고 전력 효율성과 보안성을 높이기 위해 자체 반도체 개발에도 상당한 투자를 하고 있다.
2022년 말 오픈AI(Open AI)가 챗GPT를 선보인 이후 마이크로소프트, 구글, 메타, 아마존과 같은 미국 빅테크들은 천문학적인 자본을 투자하며 AI 서버를 구축하기 시작했다. 이로 인해 AI 서버에 탑재되는 AI 반도체 수요가 기하급수적으로 늘어났고, 엔비다아와 SK하이닉스로 대표되는 AI 반도체 기업들의 주가는 고공행진을 하고 있다.
구글의 경우 2016년 머신러닝(ML) 엔진인 텐서플로우(TensorFlow)에 특화된 TPU를 자사 데이터 센터에 적용했다. 이세돌 9단과 대국을 펼친 알파고에도 TPU가 적용돼 있다.
최근 마이크로소프트는 자사 AI 칩 ‘마이아(Maia)’의 성능 개선을 위해 네트워크 카드를 개발 중인 것으로 알려졌다. 최근 MS는 네트워크 카드 개발을 위해 주니퍼 네트웍스 프라딥 신두 공동창업자를 영입했으며, 지난해에는 서버 칩 스타트업인 펀지블을 인수하기도 했다. 이 네트워크 카드는 엔비디아의 ‘커넥트X-7(Connect-7)’과 유사한 것으로 알려졌다.
ARM을 보유한 소프트뱅크도 자체 칩 개발에 뛰어들었다. 소프트뱅크 손정의 회장은 이 프로젝트를 ‘이자나기’로 명명하고, 1000억 달러 규모의 반도체 펀드를 조성해 AI 반도체 대량 생산을 위한 준비에 나선 것으로 알려졌다.
SK텔레콤과 한국전자통신연구원(ETRI)은 공동으로 서버용 AI 반도체인 '알데바란'을 공개했다. 기존에는 엔비디아의 초고가 GPU인 RTX2080의 GPU 코어를 이용해 초당 10조 번의 부동소수점 연산을 처리했는데, 이번에 공개된 알데바란은 초당 40조 번 부동소수점 연산을 처리할 수 있으며, 가격은 훨씬 저렴하다.
국내 AI 반도체 업체들은 이번 CES 2025에 대거 참여했다. 국내 대표적인 AI 반도체 기업인 딥엑스(DeepX)는 저전력·고성능 AI 반도체 솔루션을 개발해왔으며, 1세대 제품인 ‘DX-M1’을 올해 양산하여 글로벌 고객사에 제공할 계획인 것으로 알려졌다. DX-M1은 물리 보안 시스템, 로봇, 산업용 솔루션, 서버 등 여러 응용 분야에 특화된 AI 신경망처리장치(NPU)이다.
또 다른 AI 반도체 기업 모빌린트(Mobilint)는 온디바이스 AI용 반도체 ‘레귤러스(REGULUS)’로 CES 2025에서 혁신상을 받았다. 레귤러스는 온디바이스 AI용으로 설계된 전력 소형 AI 반도체로 손가락 한 마디보다 작은 크기임에도 전력 소모와 발열이 낮고, 10TOPS(초당 1조 번 연산)의 높은 AI 성능을 발휘한다.
국내 AI 반도체 스타트업 리벨리온(Rebellions)과 사피온의 합병법인 '리벨리온'도 공식 출범했다. 리벨리온의 기업 가치는 1조3000억원에 달하며, AI 칩 양산에 주력할 예정이다. 리벨리온은 국내 AI 반도체 기업 중 처음으로 유니콘(1조원 이상 비상장사) 기업에 올랐다. 리벨리온은 엔비디아를 추격 대상으로 삼고, 엔비디아의 주력 AI 칩을 대체할 예정이다.
이 외에도 하이퍼엑셀(HyperAccel), 파네시아(Panmnesia), 보스반도체, 사피엔반도체, 래블업 등 다양한 국내 AI 반도체 스타트업들이 CES 2025에 참가해 빛을 발했다.
- AhnLab콘텐츠마케팅팀