문서 검색

로컬 지식 베이스를 검색한 뒤, 정확한 주제 경로를 열어 없는 문서를 새로 작성할 수 있습니다.

유의사항

본 서비스가 제공하는 내용 및 자료가 사실임을 보증하지 않습니다. 시스템은 언제나 실수를 할 수 있습니다. 중요한 의사결정 및 법리적 해석, 금전적 의사결정에 사용하지 마십시오.

검색 결과

"추론 모델"에 대한 결과 289건

정확히 일치하는 문서가 없습니다.

이 주제의 표준 경로를 열면 시스템이 먼저 생성 타당성을 검토하고, 필요하면 더 적절한 위키 제목을 정한 뒤 새 한국어 문서를 초안 작성합니다.

"추론 모델" 생성

딥시크-R1

딥시크-R1(DeepSeek-R1)은 중국 인공지능 스타트업 딥시크가 2025년 1월 20일에 출시한 고성능 추론 모델이다. MIT 라이선스로 공개된 오픈 소스 모델이며, 수학·코딩·과학 추론에서 오픈AI의 o1과 유사한 성능을 보였다. 개발 비용은 약 557만 6천 달러로 경쟁 모델 대비 매우 낮았고, 엔비디아 H800 GPU 2,048개로 훈련되었다. 출시 직후 딥시크-R1 기반 챗봇은…

10조 파라미터 모델

10조 파라미터 모델은 인공지능의 지능을 결정하는 매개변수(Parameter)의 총합이 10조 개에 이르는 초거대 모델을 의미한다. 2020년대 중반 기술 기업들이 1조 파라미터 규모의 모델을 잇달아 공개함에 따라, 10조 규모는 인공지능 성능 고도화의 다음 단계이자 인간 수준의 추론 능력을 갖추기 위한 기술적 목표로 평가받는다. 이러한 모델은 방대한 데이터를 학습하여 텍스트, 이미지, 비…

대규모 언어 모델

대규모 언어 모델(Large Language Model, LLM)은 수십억 개 이상의 파라미터를 보유한 인공 신경망으로 구성된 언어 모델이다. 자기 지도 학습이나 반자기지도학습을 통해 레이블링되지 않은 방대한 양의 텍스트 데이터를 훈련하며, 이를 통해 자연어의 맥락과 패턴을 파악한다. 2018년경부터 본격적으로 등장하였으며, 텍스트 생성, 번역, 요약, 추론 등 광범위한 자연어 처리 작업을…

거대언어모델

거대언어모델(Large Language Model, LLM)은 수많은 매개변수(Parameter)를 보유한 인공 신경망 기반의 언어 모델이다. 방대한 양의 데이터 세트를 학습하여 콘텐츠를 인식, 요약, 번역, 예측 및 생성하는 기능을 수행한다. 2017년 발표된 트랜스포머(Transformer) 아키텍처를 주요 기반으로 하며, 2018년경부터 본격적으로 등장하여 자연어 처리 연구의 중심이…

대형언어모델

대형언어모델(LLM)은 수많은 파라미터(보통 수십억 웨이트 이상)를 보유한 인공 신경망으로 구성되는 언어 모델이다. 자기 지도 학습이나 반자기지도 학습을 사용하여 레이블링되지 않은 상당한 양의 텍스트로 훈련된다. LLM은 2018년 즈음에 모습을 드러냈으며 다양한 작업을 수행하기 위해 사용된다. 이전의 특정 작업에 특화된 지도 학습 모델의 훈련 패러다임에서 벗어나 자연어 처리 연구의 초점이…

대형 언어 모델

대형 언어 모델(Large Language Model, LLM)은 수많은 파라미터를 보유한 인공 신경망으로 구성되는 언어 모델이다. 일반적으로 수십억 개 이상의 웨이트를 가지며, 레이블링되지 않은 방대한 양의 텍스트 데이터를 자기 지도 학습이나 반자기지도학습 방식으로 훈련한다. 2018년경부터 본격적으로 등장하였으며, 특정 작업에 특화된 기존의 지도 학습 패러다임에서 벗어나 자연어 처리 연…

오픈AI

오픈AI는 강화 학습, 생성형 AI, 멀티모달 모델 등 다양한 분야에서 연구를 수행한다. 주요 연구 성과로는 GPT 시리즈, CLIP, DALL·E 등이 있다. 2026년 현재 추론 모델의 사고 과정 제어, 프런티어 LLM의 명령 계층 구조 개선 등 최신 연구를 발표하고 있다. 회사는 AGI 개발을 최종 목표로 삼고 있으며, 안전하고 책임 있는 AI 배포를 위한 원칙을 준수한다.

오픈소스 인공지능

Meta는 투명하고 안전한 AI를 위해 오픈소스 접근이 필수적이라고 주장한다. 더 많은 개발자가 참여할수록 코드 검토를 통해 문제를 더 빠르게 발견하고 해결할 수 있다. OpenAI는 GPT-OSS-Safeguard라는 맞춤형 안전 정책을 지원하는 개방형 안전 추론 모델을 제공한다. NVIDIA Nemotron은 투명한 학습 데이터와 광범위한 플랫폼 지원을 통해 신뢰할 수 있는 AI 에이전…

딥시크 (기업)

딥시크는 2023년 7월 중국 헤지펀드 하이플라이어의 공동 창립자 량원펑이 설립하였다. 2024년 12월에는 6,710억 개의 매개변수를 가진 DeepSeek-V3 모델을 공개하였고, 2025년 1월 10일에는 고성능 추론 모델 DeepSeek-R1을 기반으로 한 챗봇을 iOS와 안드로이드용으로 출시하였다. 2025년 1월 27일, 딥시크-R1은 미국 iOS 앱 스토어에서 가장 많이 다운로…

클로드

클로드(Claude)는 앤스로픽(Anthropic)에서 개발한 대규모 언어 모델(LLM) 및 인공지능 서비스이다. 사용자의 지시에 따라 텍스트 생성, 코드 작성, 데이터 분석 등의 복잡한 추론 작업을 수행한다. 인공지능의 안전성을 확보하기 위해 '헌법적 AI(Constitutional AI)' 원칙을 적용하며, 개발자용 코딩 도구인 클로드 코드(Claude Code)와 일반 사용자용 작업…

mHC (딥러닝)

mHC(Manifold-Constrained Hyper-Connections)는 중국 AI 연구소 딥시크(DeepSeek)가 개발한 대규모 언어 모델(LLM) 학습을 위한 새로운 아키텍처 프레임워크이다. 기존 딥 트랜스포머 모델이 깊어질수록 겪는 정보 흐름 저하와 불안정성을 해결하기 위해 설계되었다. mHC는 하이퍼커넥션(Hyper-Connections) 구조에 다양체 제약(Manifold…

AI 에이전트

AI 에이전트는 주어진 목표를 달성하기 위해 환경을 인식하고, 스스로 워크플로를 설계하며, 필요한 도구를 호출하여 작업을 완수하는 지능형 시스템이다. 대규모 언어 모델(LLM)을 핵심 엔진으로 삼아 자연어 이해뿐만 아니라 추론, 계획, 실행 능력을 갖춘 것이 특징이다. 단순한 대화형 인터페이스를 넘어 외부 환경과 상호작용하며 독립적으로 하위 작업을 생성하고 실행한다.