FAIR 원칙
본 서비스가 제공하는 내용 및 자료가 사실임을 보증하지 않습니다. 시스템은 언제나 실수를 할 수 있습니다. 중요한 의사결정 및 법리적 해석, 금전적 의사결정에 사용하지 마십시오.
FAIR 원칙은 디지털 자산의 발견 가능성(Findability), 접근성(Accessibility), 상호운용성(Interoperability), 재사용성(Reusability)을 향상시키기 위해 2016년 학술지 《사이언티픽 데이터(Scientific Data)》에 발표된 지침이다. 이 원칙은 데이터의 양과 복잡성이 증가함에 따라 인간의 개입을 최소화하고 컴퓨터 시스템이 자동으로 데이터를 찾고 활용할 수 있도록 하는 '기계 실행 가능성(machine-actionability)'을 강조한다. 총 15개의 세부 원칙으로 구성되며, 연구 데이터 관리와 오픈 사이언스 구현을 위한 국제적인 표준으로 자리 잡았다.
개요
FAIR 원칙은 학계, 산업계, 연구비 지원 기관, 학술 출판사 등 다양한 이해관계자가 공동으로 설계한 측정 가능한 지침이다. 기존의 데이터 공유 방식이 인간 중심이었던 것과 달리, FAIR는 기계가 데이터를 자동으로 식별하고 처리할 수 있는 능력에 중점을 둔다. 이는 데이터의 생성 속도와 복잡성이 인간의 처리 능력을 넘어서는 현대 연구 환경에서 데이터의 재사용성을 극대화하기 위해 고안되었다.
배경
학술 데이터의 재사용을 지원하는 인프라 개선에 대한 긴급한 필요성에 따라 제안되었다. 2016년 'The FAIR Guiding Principles for scientific data management and stewardship'이라는 논문을 통해 공식화되었으며, 연구 데이터 관리의 모범 사례를 표준화하는 것을 목적으로 한다. 데이터 저장소가 신뢰할 수 있는 관리 원칙을 준수하도록 장려하며, 연구자가 데이터를 등록할 때 필요한 정보를 입력함으로써 자연스럽게 원칙을 준수할 수 있도록 설계되었다.
4대 원칙 및 세부 항목
FAIR 원칙은 네 가지 범주 아래 총 15개의 세부 원칙으로 나뉜다.
| 범주 | 주요 내용 |
|---|---|
| Findable (발견 가능성) | 데이터와 메타데이터에 전역 고유 영구 식별자(PID)를 할당하고, 풍부한 메타데이터로 기술하여 검색 가능하게 한다. |
| Accessible (접근 가능성) | 표준화된 통신 프로토콜을 통해 데이터에 접근할 수 있어야 하며, 데이터가 삭제된 후에도 메타데이터는 유지되어야 한다. |
| Interoperable (상호운용성) | 지식 표현을 위해 공유된 언어와 어휘(온톨로지)를 사용하며, 다른 데이터와의 관계를 명시한다. |
| Reusable (재사용성) | 명확한 라이선스와 상세한 출처 정보를 포함하여 데이터가 커뮤니티 표준에 맞게 기술되어야 한다. |
적용 및 실천
FAIR 원칙의 실질적인 구현을 위해 GO FAIR 이니셔티브는 'Three-point FAIRification Framework'를 제공한다. 데이터 저장소는 CoreTrustSeal과 같은 인증을 통해 데이터 관리의 신뢰성과 FAIR 준수 여부를 검증받을 수 있다. 연구자는 데이터에 명확한 라이선스를 부여하고 영구 식별자를 할당함으로써 데이터의 재사용 조건을 명확히 규정한다. 최근에는 디지털 아카이브 평가와 개선을 위한 도구로도 널리 활용되고 있다.