문서 검색

로컬 지식 베이스를 검색한 뒤, 정확한 주제 경로를 열어 없는 문서를 새로 작성할 수 있습니다.

유의사항

본 서비스가 제공하는 내용 및 자료가 사실임을 보증하지 않습니다. 시스템은 언제나 실수를 할 수 있습니다. 중요한 의사결정 및 법리적 해석, 금전적 의사결정에 사용하지 마십시오.

검색 결과
"DeepSeek"에 대한 결과 636

딥시크

딥시크(DeepSeek, 深度求索)는 중국 저장성 항저우시에 본사를 둔 인공지능 연구 및 개발 기업이다. 2023년 5월 중국의 퀀트 헤지펀드인 하이플라이어(High-Flyer)의 공동 창립자 량원펑이 설립하였다. 대형 언어 모델(LLM) 분야에서 전문가 혼합(MoE) 기술을 활용해 기존 빅테크 기업 대비 압도적으로 낮은 비용으로 고성능 모델을 구현하며 주목받았다. 주요 모델인 딥시크-V3…
조회수 23

딥시크

딥시크(DeepSeek)는 중국의 인공지능(AI) 기술 개발 기업이다. 2023년 7월 중국 헤지펀드 하이플라이어(High-Flyer)의 공동 창립자 량원펑에 의해 설립되었다. 대규모 언어 모델(LLM) 분야에서 기존 경쟁사 대비 현저히 낮은 비용으로 고성능 모델을 구현하여 시장에 큰 충격을 주었으며, 주요 모델의 가중치를 공개하는 오픈 웨이트 방식을 채택하고 있다.
조회수 16

DeepSeek V4

DeepSeek V4는 중국의 인공지능 기업 딥시크(DeepSeek-AI)가 2026년 4월 24일 프리뷰(Preview) 버전으로 공개한 4세대 대규모 언어 모델(LLM)이다. Mixture-of-Experts(MoE) 아키텍처를 기반으로 설계되었으며, 최대 100만 토큰의 컨텍스트 길이를 지원하는 것이 핵심 특징이다. DeepSeek-V4-Pro와 DeepSeek-V4-Flash 두 가…
조회수 16

딥시크-R1

딥시크-R1(DeepSeek-R1)은 중국 항저우에 본사를 둔 인공지능 스타트업 딥시크가 2025년 1월 20일에 출시한 고성능 추론 모델이다. 수학, 코딩, 과학적 논리 추론 분야에서 오픈AI의 o1 모델과 대등한 성능을 보이면서도 개발 비용을 획기적으로 낮추어 주목받았다. MIT 라이선스를 통해 오픈 소스로 공개되었으며, 출시 직후 미국 앱스토어에서 다운로드 1위를 기록하는 등 글로벌…
조회수 13

Native Sparse Attention

Native Sparse Attention(NSA)은 DeepSeek-AI 연구진이 2025년에 발표한 희소 어텐션 메커니즘이다. 기존 표준 어텐션의 높은 계산 비용을 줄이기 위해 설계되었으며, 동적 계층적 희소 전략을 통해 전역 문맥 인식과 지역 정밀도를 동시에 유지한다. 하드웨어 정렬 최적화를 적용하여 실질적인 속도 향상을 달성하고, 학습 가능한 구조로 설계되어 사전 학습부터 추론까지…
조회수 15

Ollama

Ollama는 다양한 최신 오픈 소스 모델 시리즈를 지원하며, 공식 라이브러리를 통해 지속적으로 업데이트된다. 모델 시리즈 주요 특징 Llama / Gemma 메타와 구글에서 공개한 범용 모델 시리즈 DeepSeek / Qwen 추론 및 코딩 능력이 강화된 모델 Mistral / Kimi 효율적인 성능을 제공하는 오픈 모델 gpt-oss 오픈 소스 기반의 GPT 계열 모델 기타 Nemotr…
조회수 28

10조 파라미터 모델

조 단위 이상의 파라미터를 효율적으로 운용하기 위해 다양한 최적화 기술이 적용된다. 혼합 전문가(MoE, Mixture of Experts): 전체 파라미터 중 특정 연산에 필요한 일부 전문가 모델만 활성화하는 방식이다. 예를 들어 딥시크(DeepSeek) V4 Pro는 1.6조 개의 파라미터를 보유하면서도 추론 시에는 약 490억 개의 활성 파라미터만 사용하여 효율성을 높인다. 스파스 아…
조회수 36

애플 뉴럴 엔진

애플은 생성형 AI 시대를 맞아 뉴럴 엔진의 활용 범위를 대형 언어 모델(LLM)로 확장하고 있다. 2024년 출시된 M4 칩은 AI 기능을 담당하는 NPU 성능 확대에 주력하여 설계되었다. 또한, 소프트웨어 생태계 확장을 위해 오픈소스 프로젝트인 ANEMLL이 공개되었다. ANEMLL은 허깅페이스(Hugging Face)의 모델을 뉴럴 엔진에 최적화된 CoreML 포맷으로 변환하고 배포할…
조회수 21

OpenCLAW

전체 코드의 약 91% 이상이 TypeScript로 작성되었으며, 멀티 플랫폼 환경을 지원하기 위해 Swift, Kotlin, Go, Python 등 다양한 언어가 혼합되어 있다. 지원하는 AI 모델은 다음과 같다. 구분 지원 모델 상용 모델 Claude, GPT, Gemini, DeepSeek, Grok 로컬 모델 Ollama 등을 통한 오픈 소스 모델 사용자는 자신의 환경에 맞춰 API…
조회수 14

Unsloth

Unsloth는 인공지능 모델의 학습 효율을 극대화하기 위해 설계된 라이브러리이다. 특히 대규모 언어 모델의 미세 조정(Fine-tuning) 과정에서 발생하는 연산 비용과 메모리 점유 문제를 해결하는 데 중점을 둔다. Llama, Mistral, Gemma, DeepSeek 등 주요 오픈소스 모델을 지원하며, 사용자가 로컬 하드웨어에서도 고성능 모델을 효율적으로 훈련할 수 있도록 돕는다.
조회수 17

미중 기술 전쟁

양국은 미래 패권의 핵심인 AI와 반도체 부문에서 치열한 주도권 다툼을 벌이고 있다. 미국의 기술 봉쇄: 미국은 엔비디아(NVIDIA)의 AI 칩인 H20 등 첨단 반도체의 중국 수출을 제한하고 있다. 이는 중국의 첨단 기술 접근을 차단하여 군사적·기술적 우위를 억제하려는 전략이다. 중국의 자립 전략: 중국은 미국의 견제에 맞서 반도체 자립과 기술 국산화에 속도를 내고 있다. 특히 '딥시크…
조회수 17

ANEMLL

다양한 최신 대규모 언어 모델을 지원하며, 허깅페이스의 anemll 조직을 통해 사전 변환된 모델을 제공한다. 모델군 세부 모델 및 규모 Gemma 3 270M, 1B, 4B (QAT 지원) LLaMA 3.1 / 3.2 1B 8B Qwen 3 / 2.5 0.6B 1.7B DeepSeek R1 Distill 버전 DeepHermes Distill 버전
조회수 17