본문 바로가기
시장동향

AI 가성비 전쟁: 알리바바 큐원2.5 맥스

by Zoozoobs Studio 2025. 1. 30.
반응형

중국의 인공지능(AI) 경쟁이 점점 더 치열해지는 양상입니다. 이번에는 가성비의 알리바바가 새로운 AI 모델을 공개하며, 기존 모델들을 능가한다고 발표했습니다. 알리바바는 2025년 1월 28일 홈페이지를 통해 새로운 AI 모델 큐원(Qwen)2.5-맥스를 공개하고 API를 출시했습니다. 자본과 하드웨어 성능으로 승부하던 AI 모델이 중국의 참전으로 인해 창의적인 방식으로 가성비(가격 대비 성능비)를 높여가는 양상입니다.

2024년 5월 중국 딥시크(DeepSeek)가 출시한 딥시크-V2 모델은 오픈소스로 공개되면서 파격적인 가격 정책을 내세운 바 있습니다. 100만 토큰당 1위안(약 200원)이라는 전례 없는 저렴한 가격으로 시장을 흔들어 놓은 것입니다. 이에 대응해 알리바바는 자사의 AI 모델 가격을 무려 97%까지 인하하는 등 본격적인 가격 경쟁에 뛰어들었습니다. 이 경쟁은 바이두, 텐센트 등 다른 중국의 빅테크 기업들까지 가세하면서 더욱 치열해지고 있습니다.


효율성을 높인 AI 모델

큐원2.5-맥스 모델은 20조개가 넘는 토큰으로 사전 학습하고 인간 선호도에 맞춘 감독미세조정(SFT)과 인간 피드백을 통한 강화 학습(RLHF)으로 미세조정한 대형언어모델(LLM)입니다. 딥시크-V3처럼 MoE로, 적은 매개변수만 사용해 모델의 효율성을 높였다고 발표했습니다. MoE란 인공지능 모델에서 여러 개의 전문가 모델을 두고 특정 입력에 따라 적절한 전문가를 선택하여 학습 및 추론을 수행하는 방식입니다. 모든 전문가 모델을 사용하지 않고 일부만 활성화하기 때문에 연산량이 감소해 효율적으로 운영할 수 있습니다.

알리바바는 큐원2.5-맥스 모델의 매개변수나 학습 데이터 등은 공개하지 않았습니다. 그 대신, 벤치마크 결과를 강조하며 비교 모델로는 V3를 비롯해 라마 3.1-405B, GPT-4o, 클로드 3.5-소네트 등을 제시했습니다. 추론 모델인 오픈AI의 o1과 딥시크의 R1은 포함하지 않은 BM(Benchmark) 결과입니다.

큐원2.5-맥스의 추론 능력을 가리는 벤치마크는 Arena-Hard, MMLU-Pro, GPQA-Diamond, LiveCodeBench, LiveBench 등의 벤치마크 테스트를 거쳤고, 그 결과 Arena-Hard와 LiveBench 등 2개 분야에서 1위를 차지했습니다. MMLU-Pro와 GPQA-Diamond 등 지식 테스트와 LiveBench에서도 GPT-4o와 클로드3.5-소네트에 맞먹는 성능을 보였습니다. 특히, 5개 분야 모두에서 딥시크-V3의 성능을 모두 능가했습니다.


 

벤치마크 결과 (사진=알리바바)

 

중국의 AI 경쟁

딥시크-V3는 2024년 12월 26일 출시된 모델로 다음과 같은 이유로 중국 AI 열풍의 시동을 걸었다는 평가를 받은 모델입니다.

  • 6710억개의 매개변수로 오픈 소스 사상 최대 규모
  • MoE 방식을 통해 매개변수 340억개만 활성화하는 방식으로 추론 비용과 메모리 사용량 절감
  • 엔비디아 H800 GPU로 2개월간 557만달러(약 82억원)만으로 학습

하지만, 큐원 시리즈로 오픈 소스 최강자 중 하나로 꼽혔던 알리바바가 V3를 누르기 위해 내놓은 것이 큐원2.5-맥스입니다. 매개변수나 훈련 비용은 밝히지 않았으나, MoE를 강조한 점이나 벤치마크 결과는 V3와 매우 흡사합니다. 큐원2.5-맥스는 아직 개발 중이며, 기존 플랫폼인 큐원 채팅에서 이용 가능합니다. 또 알리바바 클라우드의 모델 스튜디오를 통해 API를 이용할 수 있습니다.

2024년 12월 22일 바이트댄스는 기존 모델 두바오(Daubao)를 업그레이드한 추론 모델 두바오-1.5-프로를 출시했습니다. 이 모델은 o1을 타깃으로 한 것으로, 벤치마크에서 o1과 비슷한 성능을 보였습니다. 또 딥시크의 R1처럼 높은 성능뿐만 아니라 비용이 저렴하다는 강점을 내세웠습니다.


AI 경쟁의 양상은 가격과 접근성

아래는 큐원2.5-맥스, 딥시크-R1, GPT-4 API의 각 토큰 입력/출력 비용을 비교한 것입니다. 비슷한 성능이라면 비용이 낮은 쪽이 당연히 시장의 선택을 받을 것입니다.

 
특징
큐원(Qwen) 2.5-맥스
DeepSeek R1
GPT-4 API
입력 토큰 비용
정보 없음
$0.55/백만 토큰 (캐시 미스)
$30.00/백만 토큰
입력 토큰 비용 (캐시 적중)
정보 없음
$0.14/백만 토큰
해당 없음
출력 토큰 비용
정보 없음
$2.19/백만 토큰
$60.00/백만 토큰
캐싱 메커니즘
정보 없음
있음 (최대 90% 비용 절감)
정보 없음
가격 정책
구체적 정보 없음
투명하고 경쟁력 있는 가격 모델
정보 없음
오픈소스 여부
아니오 (API만 제공)
예 (MIT 라이선스)
아니오
비용 효율성
정보 없음
OpenAI 모델 대비 매우 높음
기준 모델

이 표의 주목할 만한 점은 다음과 같습니다.

  1. 딥시크-R1은 캐싱 메커니즘을 통해 반복적인 쿼리에 대해 최대 90%의 비용 절감을 제공합니다.
  2. 큐원2.5-맥스는 API로만 제공되며, 오픈소스로 공개되지 않았습니다.
  3. 딥시크-R1은 오픈소스로 제공되어 사용자가 높은 비용 없이 AI 시스템에 접근, 수정, 구현할 수 있는 유연성을 제공합니다.
  4. 중국 AI 모델들 간의 경쟁으로 인해 전반적인 가격 하락 추세가 있으며, 이러한 경쟁이 AI 대량 도입과 소비자 잇점을 제공할 것입니다.

향후 AI 시장에서 가장 중요한 요소는 성능뿐만 아니라, 가격, 접근성, 활용 가능성 등이 될 것입니다. AI 모델이 아무리 뛰어난 성능을 갖추고 있더라도, 비싸거나 사용하기 어렵다면 시장에서의 경쟁력을 확보하기 힘들 것입니다. 딥시크의 파격적인 가격 정책이 성공한 이유도 여기에 있습니다. 큐원 2.5-맥스의 가격은 아직 공개되기 전이지만, 딥시크의 가격과 비슷하다면 향후 중국이 AI의 주도권을 가져갈 가능성이 높습니다.

아래는 중국 외의 AI 서비스 가격 정책을 정리한 표입니다.

딥시크-R1의 최소 인풋 비용이 $0.14/백만 토큰인 것을 감안하면, 아래 서비스들의 가격 효율성은 갈 길이 멀어 보입니다.

주요 AI 가격

결론

AI 기술이 발전하면서, 이제는 특정 기업만이 아니라 다양한 산업군에서 AI 모델을 적극적으로 활용하려는 움직임도 늘어나고 있습니다. 금융, 의료, 제조, 교육 등 여러 분야에서 AI 기반 솔루션이 도입되고 있으며, AI가 실생활과 밀접하게 연결되는 시대가 다가오고 있습니다. 이에 따라, AI 기술의 발전과 경쟁은 단순한 기업 간 경쟁이 아니라, 산업 전반의 혁신을 이끄는 핵심 동력이 될 것입니다.

 

이번 알리바바의 AI 모델 발표는 단순한 제품 출시 이상의 의미를 갖고 있습니다. 이는 중국 AI 시장의 격화된 경쟁을 보여주는 동시에, 글로벌 AI 경쟁에서도 중국 기업들이 본격적으로 영향력을 행사하기 시작했음을 알리는 신호탄이라고 할 수 있습니다. 앞으로 AI 시장이 어떻게 변화해 나갈지, 그리고 중국과 미국의 AI 기술 경쟁이 어떤 방향으로 전개될지 지켜보는 것은 매우 흥미로운 포인트가 될 것입니다.

#알리바바클라우드 #알리바바AI #큐원2.5맥스 #딥시크V3 #딥시크R1 #OpenAIo1 #바이트댄스AI #두바오 #감독미세조정 #SFT #인간피드백을통한강화학습 #RLHF #대형언어모델 #LLM #MoE #AI가성비전쟁 #가성비의알리바바 #가성비중국

반응형