딥시크-R1

딥시크-R1(DeepSeek-R1)은 중국 항저우에 본사를 둔 인공지능 스타트업 딥시크가 2025년 1월 20일에 출시한 고성능 추론 모델이다. 수학, 코딩, 과학적 논리 추론 분야에서 오픈AI의 o1 모델과 대등한 성능을 보이면서도 개발 비용을 획기적으로 낮추어 주목받았다. MIT 라이선스를 통해 오픈 소스로 공개되었으며, 출시 직후 미국 앱스토어에서 다운로드 1위를 기록하는 등 글로벌 인공지능 시장에 큰 영향을 미쳤다.

배너 광고

기술적 특징

딥시크-R1은 복잡한 문제를 해결하기 위해 논리적으로 추론하는 과정에 특화된 모델이다. 오픈AI의 o1 모델과 유사하게 응답을 내놓기 전 추가적인 연산 시간을 할애하는 테스트-타임 컴퓨트(Test-Time Compute) 기술을 적용했다. 이를 통해 모델은 질문을 받으면 수십 초 동안 단계별로 사고하는 과정을 거쳐 정확도와 신뢰성을 높인다.

초기 모델인 'DeepSeek-R1-Zero'는 순수 강화 학습을 통해 자기 진화 능력을 보여주었으나, 언어 혼합이나 가독성 문제가 발생했다. 이후 공개된 정식 버전인 R1은 감독 학습과 강화 학습을 결합하여 이러한 문제를 개선했다. 모델 가중치는 허깅페이스를 통해 배포되어 상업적 이용과 커스터마이징이 자유롭다.

성능 및 벤치마크

여러 인공지능 성능 평가 지표에서 딥시크-R1은 기존의 선도적인 모델들과 대등하거나 일부 앞서는 결과를 보였다.

수학 및 코딩: 수학 경시대회 문제를 평가하는 AIME 2024에서 79.8%의 정답률을 기록하여 오픈AI o1(79.2%)을 소폭 능가했다. MATH-500에서는 97.3%를 기록했다.
과학 추론: 박사 수준의 과학 추론을 평가하는 GPQA 다이아몬드와 상식 평가인 MMLU에서는 o1이 더 높은 점수를 받았으나, 딥시크-R1 역시 이에 근접한 성능을 유지했다.
프로그래밍: 코드포스(Codeforces)에서 2,029 Elo 등급을 달성하여 인간 참가자의 상위 3.7%에 해당하는 실력을 보였다.

경제성 및 효율성

딥시크-R1의 가장 큰 특징은 압도적인 비용 효율성이다. 모델 훈련에 투입된 비용은 약 557만 6,000달러(약 80억 원)로, 이는 메타의 라마(Llama) 3.1 개발 비용의 약 10% 수준이며 오픈AI의 GPT-4 개발비와 비교해도 매우 낮다.

훈련에는 엔비디아의 중국 수출용 GPU인 H800 2,048개가 사용되었다. 이는 전문가 혼합(MoE) 레이어와 같은 기술을 통합하여 연산 자원을 효율적으로 사용한 결과이다. API 사용 요금 또한 경쟁 모델 대비 90~95% 저렴하게 책정되어 기업들의 도입 장벽을 낮추었다. 입력 토큰 100만 개당 약 0.55달러, 출력 토큰 100만 개당 약 2.19달러 수준이다.

딥시크-R1과 오픈AI o1 모델들의 토큰당 API 가격 비교 그래프 — 딥시크-R1은 경쟁 모델 대비 입력 및 출력 API 비용이 현저히 낮아 높은 경제성을 보여준다.中 AI 스타트업 딥시크 "추론 모델 'R1', 오픈AI o1보다 싸고, 성능 뛰어나" < 글로벌 < 월드AI < 기사본문 - AI포스트(AIPOST)

규제 및 논란

급격한 확산과 함께 보안 및 정치적 중립성에 대한 우려가 제기되었다. 2025년 2월, 대한민국 정부는 개인정보 유출 및 보안 우려를 이유로 산업통상자원부, 외교부, 국방부 등 주요 부처의 딥시크 접속을 일시적으로 차단했다. 한국수력원자력, 카카오, 라인야후 등 공공기관과 민간 기업들도 사용 제한 조치를 취했다.

또한 중국 정부의 검열 정책을 준수함에 따라 특정 정치적 주제에 대한 답변을 거부하거나 편향된 정보를 제공할 수 있다는 점이 한계로 지적된다. 이탈리아 등 일부 국가에서도 데이터 보호 측면의 위험성을 이유로 규제 검토에 착수한 것으로 알려졌다.

참고 자료

5건

中 AI 스타트업 딥시크 "추론 모델 'R1', 오픈AI o1보다 싸고, 성능 뛰어나" < 글로벌 < 월드AI < 기사본문 - AI포스트(AIPOST)中 AI 스타트업 딥시크 "추론 모델 'R1', 오픈AI o1보다 싸고, 성능 뛰어나" < 글로벌 < 월드AI < 기사본문 - AI포스트(AIPOST) 이전 기사보기 다음 기사보기 中 AI 스타트업 딥시크 "추론 모델 'R1', 오픈AI o1보다 싸고, 성능 뛰어나" 스크롤 이동 상태바 유진 기자다른기사 보기 (사진=딥…https://www.aipostkorea.com/news/articleView.html?idxno=5799 중국서 'o1'과 경쟁하는 추론 모델 ‘딥시크-R1’ 출시 < 산업일반 < AI산업 < 기사본문 - AI타임스중국서 'o1'과 경쟁하는 추론 모델 ‘딥시크-R1’ 출시 < 산업일반 < AI산업 < 기사본문 - AI타임스 www.aitimes.com 발행일: 2026-05-15 07:26 (금) 한국어KR 영어EN 일본어JP 중국어CH 이전 기사보기 다음 기사보기 중국서 'o1'과 경쟁하는 추론 모델 ‘딥시크-R1’ 출시 가 가…https://www.aitimes.com/news/articleView.html?idxno=165540 딥시크딥시크 딥시크(DeepSeek,중국어간체자: 深度求索,병음: Shēndù Qiúsuǒ, Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd.)는대형 언어 모델(LLM)을 개발하는 중국의인공지능회사이다.저장성 항저우시에 본사를 둔 딥시크…https://ko.wikipedia.org/wiki/%EB%94%A5%EC%8B%9C%ED%81%AC 중국 개발 ‘가성비 최강’ AI 등장에…미국 빅테크 ‘패닉’중국 개발 ‘가성비 최강’ AI 등장에…미국 빅테크 ‘패닉’ ### 중국 개발 ‘가성비 최강’ AI 등장에…미국 빅테크 ‘패닉’ - 수정 2025-01-26 15:41 기사를 읽어드립니다Your browser does not support the`audio` element. 0:00 #### 딥시크가 1/10 연구비로…https://www.hani.co.kr/arti/economy/global/1179815.html 효율적으로 학습된 소규모 모델의 강력한 힘을 보여주는 DeepSeek의 추론 AI | IBM효율적으로 학습된 소규모 모델의 강력한 힘을 보여주는 DeepSeek의 추론 AI | IBM 태그 # 효율적으로 학습된 소규모 모델의 강력한 힘을 보여주는 DeepSeek의 추론 AI 중국 스타트업 DeepSeek의 AI 모델인 DeepSeek-R1은 지난주 출시된 지 몇 시간 만에 AI 오픈 소스 플랫폼 Hugging…https://www.ibm.com/kr-ko/think/news/deepseek-r1-ai