AI 서버 혁명의 서막: 128TB 메모리로 '메모리 월' 완전 파괴!

대규모 언어 모델(LLM)의 폭발적인 성장은 우리 삶을 뒤흔들었지만, 그 이면에는 심각한 기술적 병목 현상이 도사리고 있었다.

바로 인공지능이 데이터를 처리하는 속도를 가로막는 ‘메모리 월’이라는 숙제다.

AI 하드웨어 스타트업 Majestic Labs가 이 난제를 정면으로 돌파할 혁신적인 AI 서버, Prometheus를 공개하며 업계의 이목을 집중시키고 있다.

무려 128테라바이트(TB)에 달하는 압도적인 메모리 용량으로 기존 AI 서버의 한계를 훌쩍 뛰어넘는 모습이다.

엔비디아의 최첨단 DGX B300 서버보다 60배 이상 많은 메모리를 탑재하는 이 기술은 LLM 추론 성능을 비약적으로 끌어올릴 핵심 열쇠가 될 것이라는 기대가 크다.

DRAM 혁신으로 메모리 벽을 허물다

현대 LLM은 방대한 데이터를 빠르게 읽어 들이고 처리해야 하는데, 기존 서버는 주로 빠른 고대역폭 메모리(HBM)와 상대적으로 느린 일반 동적 램(DRAM)을 조합하는 방식을 택한다.

하지만 모델이 커질수록 HBM만으로는 부족하고, 느린 DRAM이 데이터 병목을 일으켜 ‘메모리 월’을 더욱 공고히 하는 경우가 다반사였다는 평가다.

Majestic Labs는 이 지점에서 발상의 전환을 꾀했다.

LPDDR6 기반의 DRAM을 단일 아키텍처로 통합하고, 최대 1미터까지 확장 가능한 독자적인 구리 케이블 메모리 인터페이스를 개발한 것.

이는 물리적인 한계로 인해 더 많은 메모리를 탑재하기 어려웠던 기존 시스템의 벽을 허무는 결정적인 기술로 보인다.

메모리 집적 칩이 이 인터페이스를 통해 수많은 DRAM 칩들을 효율적으로 관리하며 초당 최대 25.6테라바이트의 어마어마한 대역폭을 구현했더라.

결과적으로, 연산 능력은 과도하게 제공하면서 메모리는 부족해지는 기존 시스템의 비효율성을 해소하는 데 집중한 전략이 돋보인다.

AI 가속화의 심장, Ignite 프로세서

물론 대규모 메모리만으로는 충분하지 않다. 데이터를 빠르게 처리할 강력한 AI 가속기가 필수적인 법.

Majestic Labs는 자체 개발한 AI 프로세서, 'Ignite' 칩 12개를 Prometheus 서버에 탑재한다.

이그나이트는 데이터센터급 ARM 애플리케이션 코어와 RISC-V 벡터 및 텐서 코어를 단일 칩에 통합하여 모든 코어가 동일한 메모리 공간을 공유한다.

이를 통해 LLM 추론에 필요한 복잡한 연산을 칩 내부에서 원활하게 처리하며, 프로세서 간의 불필요한 데이터 전달을 최소화하는 효율적인 구조를 갖춘 듯하다.

무엇보다 PyTorch, vLLM, OpenAI의 Triton 등 널리 사용되는 AI 프레임워크를 코드 수정 없이 지원하여 개발자들의 진입 장벽을 낮춘 점도 주목할 만하다.

오픈 컴퓨트 프로젝트(OCP)를 준수하고, 액체 냉각 방식을 채택하며, 메모리 모듈을 유연하게 업그레이드할 수 있는 모듈식 설계 또한 돋보인다.

Majestic Labs는 2027년 출시 예정인 Prometheus가 기존 솔루션 대비 10배에서 최대 50배까지 자본 지출과 전력 소비를 절감할 수 있을 것이라고 자신하고 있다.

자주 묻는 질문 (Q&A)

Q1: '메모리 월'은 왜 LLM 성능에 치명적인가요?

LLM은 토큰을 생성할 때 방대한 양의 데이터를 메모리에서 읽어와야 합니다. 이때 메모리에서 데이터를 가져오는 속도가 전체 처리 속도를 제한하게 되는데, 모델 크기가 커질수록 이 병목 현상은 더욱 심해지죠. 마치 수도관이 좁아서 물이 아무리 많아도 흐름이 느려지는 것과 비슷하다고 보면 됩니다.

Q2: Prometheus 서버의 가장 큰 혁신 포인트는 무엇인가요?

단연 128TB에 달하는 대용량 메모리와 이를 가능하게 한 DRAM 중심의 혁신적인 아키텍처입니다. 기존 HBM과 DRAM 조합의 한계를 넘어, 독자적인 장거리 메모리 인터페이스와 집적 칩으로 메모리 용량과 대역폭을 극대화한 것이 핵심이죠.

Q3: 엔비디아 서버와 비교했을 때 어떤 장점이 있나요?

Majestic Labs는 기존 엔비디아 시스템이 모델이 커질수록 연산 능력은 과도하게 제공하면서 메모리는 부족해지는 경향이 있다고 지적합니다. Prometheus는 메모리 병목 현상에 초점을 맞춰 대용량 DRAM과 효율적인 Ignite 프로세서로 훨씬 경제적이고 전력 효율적인 솔루션을 제공한다는 점이 차이점이라고 할 수 있겠네요.

Q4: Prometheus는 언제쯤 상용화될 예정인가요?

Majestic Labs는 Prometheus 서버가 2027년 출하될 것으로 예상하고 있습니다. 아직 가격은 공개되지 않았지만, 경쟁력 있는 가격으로 시장에 진입할 것이라는 기대를 모으고 있습니다.

마치며

AI 기술의 발전 속도는 눈부시지만, 그만큼 해결해야 할 숙제도 많았다.

특히 ‘메모리 월’은 LLM의 잠재력을 온전히 끌어내지 못하게 하는 주요 걸림돌로 여겨졌던 영역이다.

Majestic Labs의 Prometheus 서버는 이 고질적인 문제를 정면으로 돌파하려는 과감한 시도이자, 새로운 AI 하드웨어 패러다임을 제시하는 기념비적인 제품이 될 듯하다.

2027년, 프로메테우스가 실제로 시장에 등장했을 때, AI 연산의 효율성과 경제성에 어떤 혁신을 가져올지 벌써부터 기대가 커진다.

이러한 발전이 궁극적으로 더욱 강력하고 실용적인 AI 모델을 탄생시키는 밑거름이 되기를 바라본다.