오픈소스 인공지능

오픈소스 인공지능은 누구나 허가 없이 어떤 목적으로든 사용, 검토, 수정 및 배포할 수 있는 인공지능 시스템을 의미한다. 단순히 소프트웨어의 소스 코드뿐만 아니라 학습 데이터 세트의 정보, 모델의 가중치 및 매개변수, 학습 및 추론 코드 등 시스템 전반의 구성 요소를 공개하는 것이 특징이다. 이는 특정 기업의 기술 독점을 방지하고, 전 세계 개발자와 연구자의 협업을 통해 기술 혁신과 안전성 검증을 가속화하는 역할을 한다.

배너 광고

정의 및 범위

오픈소스 인공지능은 오픈 소스 이니셔티브(OSI)가 확립한 정의에 따라 자유롭게 사용하고 변경할 수 있는 시스템이다. 일반적인 오픈소스 소프트웨어보다 범위가 넓으며, 다음과 같은 요소를 포함한다.

소스 코드: 모델 학습, 테스트, 데이터 필터링 및 추론을 위한 코드
모델 가중치: 학습을 통해 결정된 모델의 매개변수 값
데이터 정보: 학습 데이터의 출처, 선택 방법, 처리 절차 등에 대한 설명

다만, 개인 식별 정보(PII)와 같이 법적으로 공유할 수 없는 비공개 데이터는 공개 범위에서 제외될 수 있다.

라이선스와 법적 체계

오픈소스 인공지능은 주로 자유-오픈 소스 소프트웨어(FOSS) 라이선스를 사용하여 접근 및 재배포 조건을 명시한다.

Apache 2.0: 카피레프트 제한이나 특허 침해 위험 없이 자유로운 구축, 실험, 상업적 배포를 허용한다.
오픈 웨이트(Open Weights): 소스 코드는 비공개일 수 있으나 모델의 가중치만을 공개하여 사용자가 로컬 환경에서 실행하거나 미세 조정(Fine-tuning)할 수 있게 하는 방식이다.
기타 라이선스: MIT 허가서, GNU 일반 공중 사용 허가서(GPL) 등이 사용된다.

주요 모델 및 프로젝트

다양한 기업과 커뮤니티가 오픈소스 또는 개방형 모델을 제공하며 생태계를 확장하고 있다.

모델/프로젝트명	개발 주체	특징
LLaMA 시리즈	Meta	오픈소스 생태계 확장을 주도하는 대형 언어 모델
gpt-oss	OpenAI	200억 및 1,200억 파라미터 규모의 개방형 추론 모델
Nemotron	NVIDIA	엔터프라이즈 에이전트 구축을 위한 개방형 파운데이션 모델
vLLM	커뮤니티	고성능 LLM 추론 및 서빙을 위한 오픈소스 엔진

장점과 투명성

오픈소스 모델은 폐쇄형(Proprietary) 모델에 비해 다음과 같은 이점을 가진다.

데이터 제어권: 기업이 자체 인프라(온프레미스) 내에서 모델을 구동하여 민감한 정보 유출을 방지할 수 있다.
비용 효율성: 독점 모델의 라이선스 비용을 절감하고 필요한 용도에 맞춰 최적화가 가능하다.
기술 민주화: 소수 기업에 힘이 집중되는 것을 막고 사회 전반에 기술을 고르게 배포할 수 있다.
유연성: 특정 비즈니스 문제 해결을 위해 모델 아키텍처를 자유롭게 수정할 수 있다.

안전성 및 윤리적 쟁점

오픈소스 인공지능의 안전성에 대해서는 상반된 시각이 존재한다.

긍정적 측면: 더 많은 개발자가 참여하여 코드와 모델의 결함을 빠르게 발견하고 해결할 수 있다. 투명한 공개를 통해 시스템의 신뢰도를 높인다.
부정적 측면: 악의적인 사용자가 모델에 내장된 안전 프로토콜을 임의로 제거하거나 유해한 목적으로 재학습시킬 위험이 있다.

이에 대응하여 'gpt-oss-safeguard'와 같이 맞춤형 안전 정책을 지원하는 모델도 개발되고 있다.

참고 자료

6건

오픈 소스 인공지능오픈 소스 인공지능 오픈 소스 인공지능(open-source artificial intelligence)은 자유롭게 사용, 연구, 수정 및 공유할 수 있는 AI 시스템이다. 이러한 특성은 데이터 세트, 코드 및 모델 매개변수를 포함하여 시스템의 각 구성 요소에 적용되어 AI 개발에 대한 협업적이고 투명한 접근 방식을 촉…https://ko.wikipedia.org/wiki/%EC%98%A4%ED%94%88_%EC%86%8C%EC%8A%A4_%EC%9D%B8%EA%B3%B5%EC%A7%80%EB%8A%A5 오픈 소스 AI란 무엇인가요? | IBM오픈 소스 AI란 무엇인가요? | IBM # 오픈 소스 AI란 무엇인가요? ## 오픈 소스 AI란 무엇인가요? 오픈 소스 AI는 허가를 요청하지 않고도 어떤 목적으로든 사용, 검토, 변경 및 배포할 수 있는인공 지능시스템을 말합니다. 이러한 자유는 전 세계적으로 오픈 소스 원칙 및 정책의 관리자로 간주되는 오픈 소스 이…https://www.ibm.com/kr-ko/think/topics/open-source-ai 오픈 소스 대규모 언어 모델이란 무엇인가요? | IBM오픈 소스 대규모 언어 모델이란 무엇인가요? | IBM 태그 # 오픈 소스 대규모 언어 모델: 이점, 위험 및 유형 대규모 언어 모델(LLM)은인공 지능(AI), 딥 러닝 및 웹사이트, 기사 및 책을 포함한 방대한 데이터 세트를 사용하여 텍스트를 생성하고 언어 간 번역을 하며 다양한 유형의 콘텐츠를 작성하는파운데이션 모…https://www.ibm.com/kr-ko/think/topics/open-source-llms LLM 선택: 2024년 오픈 소스 LLM 시작 안내서 | Elastic BlogLLM 선택: 2024년 오픈 소스 LLM 시작 안내서 | Elastic Blog Skip to main content # LLM 선택: 2024년 오픈 소스 LLM 시작 안내서 By 2024년 2월 5일 트위터에서 공유하기 링크드인에서 공유하기 페이스북에서 공유하기 이메일로 공유하기 인쇄하기 2023년에 AI가 도약했…https://elastic.co/kr/blog/open-source-llms-guide 오픈 소스 LLM이란? - ServiceNow오픈 소스 LLM이란? - ServiceNow 오픈 소스 LLM(대규모 언어 모델)은 공개적으로 사용할 수 있는 자연어 텍스트 및 소프트웨어 프로그램 코드 데이터를 사용하여 인간의 언어를 학습하고 이해해서 복제하는 AI 모델입니다. 오픈 소스 LLM이란? 오픈 소스 LLM(대규모 언어 모델)은 공개적으로 사용할 수 있는…https://www.servicenow.com/kr/ai/what-are-open-source-llms.html Open Source AI - Meta AIhttps://ai.meta.com/opensourceai/ko