Sloth (머신러닝)
본 서비스가 제공하는 내용 및 자료가 사실임을 보증하지 않습니다. 시스템은 언제나 실수를 할 수 있습니다. 중요한 의사결정 및 법리적 해석, 금전적 의사결정에 사용하지 마십시오.
Sloth는 컴퓨터 비전 연구를 위해 이미지와 비디오 데이터에 라벨을 붙이는 도구이다. Python으로 작성되었으며, 사각형, 점, 다각형 등 표준 형태의 라벨을 지원한다. 각 라벨은 키-값 쌍으로 구성되며 'class' 키가 필수이다. 2011년에 처음 공개되었고, cvhciKIT 그룹이 개발하였다. 2013년 v1.0이 릴리스되었으며, 2020년까지 유지보수되었다.
개요
Sloth는 컴퓨터 비전 연구에서 이미지와 비디오 데이터에 라벨을 붙이기 위한 도구이다. Python으로 작성되었으며, 2011년 6월 10일에 GitHub에 공개되었다. cvhciKIT 그룹이 개발하였고, 2020년 1월까지 유지보수되었다. GitHub에서 611개의 별을 받았다. 공식 문서는 sloth.readthedocs.io에서 제공된다.
주요 기능
Sloth는 이미지나 비디오 프레임에 라벨을 추가할 수 있다. 각 라벨은 키-값 쌍의 집합이며, 'class' 키가 필수이다. 예를 들어 {"class": "rect", "id": "Martin", "x": 10, "y": 30, "width": 40, "height": 50}와 같은 형태이다. 'class' 값에 따라 시각화 방식이 결정된다. Sloth는 사각형, 점, 다각형 등 표준 형태의 라벨을 지원하며, 사용자 정의 시각화도 추가할 수 있다. 라벨은 JSON 형식으로 저장된다.
아키텍처
Sloth는 컨테이너(Container) 개념을 사용하여 라벨 데이터의 로딩과 저장을 처리한다. AnnotationContainer 기본 클래스는 load, save, filename, loadImage, loadFrame 함수를 제공하며, 사용자 정의 컨테이너를 작성하여 특정 라벨 형식을 지원할 수 있다. 또한 인서터(Inserter)를 통해 새로운 라벨을 추가하는 동작을 제어할 수 있다. 시각화는 클래스 값에 매핑되며, 사용자 정의 시각화를 추가할 수 있는 확장 구조를 갖춘다.
사용 방법
Sloth의 사용 방법은 공식 문서(sloth.readthedocs.io)에 상세히 설명되어 있다. 기본적으로 이미지나 비디오를 불러온 후 라벨을 추가하고 저장하는 방식으로 동작한다. 라벨은 JSON 형식으로 저장된다. 명령줄에서 sloth 명령어를 실행하거나, Python 스크립트에서 라이브러리로 임포트하여 사용할 수 있다. 설치 방법은 pip를 통해 pip install sloth로 가능하다.
역사
Sloth는 2011년 6월 10일에 cvhciKIT 그룹에 의해 처음 GitHub에 공개되었다. 2013년 11월 29일에 v1.0이 릴리스되었다. 이후 2020년 1월 6일까지 총 8명의 기여자가 참여하여 개발되었다. 현재는 더 이상 활발히 개발되지 않지만, 컴퓨터 비전 연구에서 데이터 라벨링 도구로 여전히 사용된다. GitHub 저장소에는 48개의 열린 이슈가 있으며, 일부 버그 및 기능 요청이 남아 있다.
관련 프로젝트
Sloth와 유사한 목적의 도구로는 LabelImg, VGG Image Annotator (VIA), CVAT 등이 있다. Sloth는 초기 오픈소스 라벨링 도구 중 하나로, 이후 다양한 도구에 영향을 주었다. 또한 Unsloth와 같은 최신 LLM 파인튜닝 도구와는 이름이 유사하지만 전혀 다른 프로젝트이다.