본문 바로가기
시장동향

DeepSeek: AI 시장을 재편하다

by Zoozoobs Studio 2025. 1. 28.
반응형

2025년 1월 27일 DeepSeek가 iPhone 앱스토어 다운로드 차트에서 1위를 차지하면서 Nvidia 주가가 약 17% 폭락했습니다. 이에 Deepseek가 AI 버블을 터뜨렸다는 주장이 제기되는 상황입니다.

 

중국의 AI인 DeepSeek R1의 등장은 AI 개발과 관련해서 그동안 기하급수적으로 늘어났던 천문학적인 자금과 연산 능력, 에너지가 필요하다는 등의 일반적인 인식을 무너뜨렸고, 미국의 대규모 AI 투자에 대한 의문을 던졌습니다. DeepSeek의 새로운 모델 시리즈인 DeepSeek R1은 지난 20일(월)에 출시된 이후 폭발적인 호평을 받으면서, Apple iPhone 앱 스토어 다운로드 차트에서 1위를 차지하게 되었습니다.

DeepSeek 주요 특징

DeepSeek은 2023년 5월에 설립된 중국의 AI 스타트업으로, 최근 AI 기술 분야에서 큰 주목을 받고 있습니다. 2023년 5월, 중국 헤지펀드인 하이플라이어(High-Flyer)의 공동 창립자이자, 중국의 샘 알트먼(OpenAI 창업주)으로 불리는 량원펑(Liang Wenfeng)에 의해 설립되었으며, 저장성 항저우에 본사를 두고 있습니다. 하이플라이어는 2016년 2월 량원펑이 공동 설립한 회사로, AI 거래 알고리즘 개발에 주력해왔습니다. 량원평이 개발한 DeepSeek의 주요 특징은 다음과 같습니다.

  1. 비용 효율성: DeepSeek은 단 560만 달러로 최신 AI 모델을 개발함. 이는 OpenAI의 연간 50억 달러, Google의 500억 달러 이상 투자와 비교하면 놀라운 차이. 이로 인해 기존의 AI 투자 비용에 대한 의문이 제기되고 있음.
  2. 기술적 혁신: DeepSeek-R1 모델은 수학적 벤치마크에서 GPT-4와 Claude 3.5 Sonnet을 능가하는 성능을 보임.
  3. 효율적 학습 방식: 순수 강화학습을 통해 AI가 스스로 학습하도록 하는 방식을 채택. 이는 방대한 훈련 데이터에 의존하던 기존 방식과 다름.
  4. 자원 효율성: 2,048개의 Nvidia GPU만을 사용하여 모델을 훈련시켰으며, 이는 경쟁사들이 사용하는 GPU 수의 약 1/8에 불과함.
  5. 리소스 최적화: 미국의 반도체 제재 속에서도 중국은 기존 하드웨어의 성능을 최대한 끌어올리는 방법을 개발함.
  6. 오픈소스 전략: DeepSeek의 기술은 MIT 라이선스로 공개되어 있어 누구나 API를 통해 활용할 수 있음.
  7. 혁신적 아키텍처: DeepSeek-V3는 Mixture-of-Experts(MoE) 아키텍처를 도입하여 6710억 개의 총 파라미터 중 370억 개만 선택적으로 활성화함. 이로 인해 성능은 극대화하면서 훈련 비용은 크게 절감함.
  8. 시장 영향: DeepSeek의 성과는 글로벌 기술 시장에 큰 영향을 미치고 있으며, 미국과 일본의 기존 기술 대기업들에게 직접적인 도전을 제기하고 있음.

 

DeepSeek 의미

DeepSeek는 새로운 모델 DeepSeek R1이 OpenAI-o1과 동등한 성능을 가지고 있다고 주장하고 있습니다. 실제로 DeepSeek R1을 사용하고 있는 많은 사람들이 성능 면에서 ChatGPT와 별다른 차이가 없다는 반응을 보이고 있습니다.

딥시크의 AI 모델은 미국의 제재로 인해 엔비디아(Nvidia) 칩 사용이 제한된 상황에서도 개발되었으며, 상대적으로 적은 비용과 자원으로 챗GPT(ChatGPT)와 유사한 수준의 작업을 수행할 수 있습니다. 2025년 1월 10일, 딥시크는 첫 번째 무료 챗봇 앱을 출시하였고, 1월 27일까지 미국 iOS 앱 스토어에서 챗GPT를 제치고 가장 많이 다운로드된 무료 앱이 되었습니다. 이러한 성공은 AI 분야에서의 경쟁 구도를 뒤흔들고 있으며, 글로벌 AI 경쟁의 시작으로 평가받고 있습니다.

딥시크는 생성형 AI 챗봇을 오픈 소스로 공개하여, 코드와 설계 문서를 자유롭게 사용, 수정, 열람할 수 있도록 허용하고 있습니다. 또한, 중국의 주요 대학에서 젊은 AI 연구자들을 적극적으로 채용하고, 컴퓨터 과학 분야 외의 인재들도 영입하여 모델의 지식과 능력을 다양화하고 있습니다.

오픈소스 문서: 

2024년 5월, 딥시크는 성능이 우수하면서도 저렴한 가격의 'DeepSeek-V2'를 출시하여 중국 AI 모델 가격 경쟁의 촉매제가 되었습니다. 이로 인해 바이트댄스(ByteDance), 텐센트(Tencent), 바이두(Baidu), 알리바바(Alibaba)와 같은 주요 기술 기업들도 자사의 AI 모델 가격을 인하하기 시작했습니다. 딥시크는 낮은 가격에도 불구하고 경쟁사들이 손실을 보는 상황에서 수익을 내고 있습니다.

하지만, 딥시크는 연구에만 집중하며 상업화에 대한 구체적인 계획은 아직 없습니다. 이러한 접근 방식은 소비자 대상 기술이 정부의 정보 통제 규제를 준수해야 하는 중국의 AI 규제에서 가장 엄격한 조항을 피할 수 있게 해줍니다.

DeepSeek과 OpenAI의 차이점

DeepSeek R1과 OpenAI o1은 모두 고급 AI 모델이지만 몇 가지 중요한 차이점이 있습니다.

  1. 비용 효율성: DeepSeek R1은 OpenAI o1보다 훨씬 저렴함. R1의 API 비용은 백만 토큰당 입력 $0.55, 출력 $2.19인 반면, o1은 각각 $15와 $60.
  2. 접근성: DeepSeek R1은 오픈소스로 MIT 라이선스 하에 제공되어 사용과 수정이 자유로움. 반면 OpenAI o1은 독점 기술임.
  3. 훈련 방법: DeepSeek R1은 순수 강화학습만을 사용하는 반면, OpenAI o1은 강화학습과 인간 피드백(RLHF)을 결합함.
  4. 성능: 두 모델은 대부분의 벤치마크에서 비슷한 성능을 보이지만, 일부 영역에서는 차이가 있음. 예를 들어, MATH 500 테스트에서 DeepSeek R1은 97.3%, OpenAI o1은 96.4%의 정확도를 보임.
  5. 특화 기능: DeepSeek R1은 자기 성찰, 성찰, 긴 사고 사슬 생성에 강점이 있고, OpenAI o1은 복잡한 문제를 단계별로 해결하는 데 특화되어 있음.

이러한 차이점들로 인해 DeepSeek R1은 비용 효율적이고 접근성이 높은 AI 솔루션을 찾는 개발자와 연구자들에게 매력적인 대안이 될 수 있습니다.

 

생성형 AI 모델의 비용이 높은 이유

그렇다면 기존 OpenAI와 같은 생성형 AI 모델의 비용이 높은 이유는 무엇이었을까요? 그에 대한 주요 이유는 다음과 같습니다.

  1. 컴퓨팅 자원: 모델 훈련에는 수천 개의 GPU가 필요하며, 이는 매우 고가의 하드웨어임.
  2. 클라우드 서비스 비용: 대부분의 AI 모델 개발이 클라우드에서 이루어지며, 이에 따른 서비스 사용료가 상당함. 단일 모델 개발에 1억 달러에 달하는 비용이 발생할 수 있음.
  3. 데이터 확보: 방대한 양의 학습 데이터를 수집하고 처리하는 데 추가적인 비용이 발생함.
  4. 훈련 시간: 모델 훈련은 수개월이 소요될 수 있으며, 이 기간 동안 지속적으로 비용이 발생함.
  5. 반복적 과정: 원하는 수준의 정확도를 얻기 위해 신경망의 가중치를 수백만 번 조정해야 할 수 있어, 이 과정에서 많은 비용이 발생함.
  6. 전문 인력: AI 모델 개발에는 고도로 숙련된 전문가가 필요하며, 이들의 인건비도 상당한 부분을 차지함.

이러한 요인들로 인해 대규모 생성형 AI 모델의 개발은 주로 대기업이나 잘 투자받은 스타트업에 의해 주도되고 있는 상황입니다.

두 모델의 비용 차이가 사용자에게 미치는 영향

DeepSeek R1과 OpenAI o1의 비용 차이는 실제 사용자에게 다음과 같은 영향을 미칠 수 있습니다.

  1. 접근성: DeepSeek R1의 낮은 비용은 더 많은 개발자와 기업이 고급 AI 기술을 활용할 수 있게 함. 이는 AI 기술의 민주화로 이어질 수 있음.
  2. 혁신 촉진: 저렴한 비용으로 인해 더 많은 스타트업과 중소기업이 AI 기술을 실험하고 혁신적인 솔루션을 개발할 수 있음.
  3. 서비스 가격: 최종 사용자에게 제공되는 AI 기반 서비스의 가격이 낮아질 수 있음. 이는 더 많은 소비자가 AI 기술의 혜택을 누릴 수 있게 함.
  4. 사용 범위 확대: 비용 효율성으로 인해 기업들이 더 다양한 분야에 AI를 적용할 수 있게 되어, 사용자들은 일상생활의 여러 측면에서 AI의 혜택을 경험할 수 있음.
  5. 리소스 할당: 기업들은 AI 모델 사용에 드는 비용을 절감함으로써, 절약된 자원을 다른 영역의 개선이나 사용자 경험 향상에 투자할 수 있음.
  6. 경쟁 촉진: 저렴한 AI 모델의 등장은 시장 경쟁을 촉진하여, 결과적으로 사용자들에게 더 나은 서비스와 다양한 선택지를 제공할 수 있음.

이러한 영향들로 인해, 비용 효율적인 AI 모델의 등장은 AI 기술의 보급과 활용을 가속화하고, 최종 사용자들에게 더 많은 혜택을 제공할 수 있을 것입니다.

 

DeepSeek R1의 강화 학습 방식의 차별점

DeepSeek R1의 강화 학습 방식은 다음과 같은 점에서 다른 AI 모델들과 차별화됩니다.

  1. 순수 강화학습 접근: DeepSeek R1-Zero는 지도학습 없이 순수 강화학습만으로 개발됨. 이는 모델이 스스로 데이터를 탐구하고 학습하도록 하는 혁신적인 접근 방식임.
  2. GRPO(Group Relative Policy Optimization) 사용: 이 방법은 평가 모델을 생략하고 '그룹 점수' 방식을 사용함. 행동들을 그룹으로 묶어 상대적으로 우수한 행동을 찾아 학습하는 방식으로, 계산이 간단하고 자원을 절약할 수 있음.
  3. '깨달음의 순간' 발견: 모델이 학습 중 문제 해결 방식을 스스로 재평가하고 수정하는 '깨달음의 순간'을 경험함. 이는 모델의 자율적인 학습과 적응 능력을 보여줌.
  4. 하이브리드 접근법: DeepSeek R1은 순수 강화학습의 한계를 극복하기 위해 강화학습과 감독 미세 조정을 결합한 하이브리드 접근 방식을 채택함. 이를 통해 모델의 일관성과 유용성이 크게 향상됨.
  5. 추론 능력 강화: 이러한 학습 방식을 통해 DeepSeek R1은 논리적 추론, 수학적 문제 해결, 실시간 의사 결정 등의 분야에서 탁월한 성능을 보임.

이러한 차별화된 강화학습 접근법은 DeepSeek R1이 기존 AI 모델들과 달리 더욱 자율적이고 적응적인 학습을 가능하게 하며, 복잡한 추론 작업에서 뛰어난 성능을 발휘할 수 있게 합니다.

DeepSeek R1 '깨달음의 순간'이 모델의 추론 능력에 미치는 영향

DeepSeek R1의 '깨달음의 순간(Aha Moment)'은 모델의 추론 능력에 다음과 같은 중요한 영향을 미칩니다.

  1. 문제 해결 방식 개선: 모델이 이전의 접근 방식을 재평가하고 더 나은 솔루션을 찾아냄. 이는 모델이 복잡한 문제에 대해 더 효과적인 해결책을 도출할 수 있게 함.
  2. 적응적 학습: '깨달음의 순간'을 통해 모델은 자율적으로 학습 전략을 조정하고 개선함. 이는 모델이 다양한 유형의 문제에 더 유연하게 대응할 수 있게 함.
  3. 추론 시간 최적화: 강화 학습이 진행될수록 모델은 복잡한 문제를 해결하기 위해 더 많은 추론 시간을 사용함. 이는 모델이 문제의 복잡성에 따라 적절한 시간을 할애하여 더 정확한 결과를 도출할 수 있게 함.
  4. 자율적 문제 해결 능력 향상: '깨달음의 순간'을 통해 모델은 외부의 지시 없이도 스스로 문제 해결 방식을 개선할 수 있게 됨. 이는 모델의 자율성과 적응력을 크게 향상시킴.
  5. 추론 패턴의 자연스러운 학습: 모델은 체인 오브 소트(Chain-of-Thought), 자기 검증(Self-Verification), 반성(Reflection) 등 다양한 추론 패턴을 스스로 학습함. 이는 모델의 추론 능력을 더욱 다양하고 강력하게 만듦.

이러한 '깨달음의 순간'의 영향으로 DeepSeek R1은 복잡한 추론 작업에서 뛰어난 성능을 보이며, 특히 수학, 코딩, 그리고 다단계 추론이 필요한 문제에서 강점을 발휘합니다.

결론

DeepSeek의 혁신적인 접근 방식과 성과는 AI 기술 분야에서 중국의 경쟁력을 크게 향상시키고 있으며, 글로벌 AI 경쟁 구도에 새로운 변화를 가져오고 있습니다. 기존 AI 개발 비용이 과도하다는 주장이 제기되는 가운데 AI 관련 주가가 크게 하락하는 시장의 반응이 뒤따랐습니다.

또한, 딥시크는 생성형 AI 챗봇을 오픈 소스로 공개하여, 코드와 설계 문서를 자유롭게 사용, 수정, 열람할 수 있도록 허용하고 있기에 발전 속도가 빨라질 것으로 보입니다. 다만, 중국 당국의 검열을 준수해야 하는 중국 내수 시장의 AI 규제는 리스크가 될 수 있습니다. 그럼에도 불구하고, 딥시크의 성공은 AI 분야에서의 경쟁 구도를 뒤흔들고 있으며, 글로벌 AI 경쟁의 시작으로 평가받고 있습니다.

#DeepSeek #Nvidia #OpenAI #AI버블 #앱스토어1위DeepSeek #DeepSeek자기성찰 #DeepSeek오픈소스 #DeepSeek깨달음의순간 #DeepSeekVSOpenAI

반응형