보완적 인공지능은 주된 학습 목표 외에 추가적인 보조 작업이나 구조를 도입하여 시스템의 성능과 안정성을 높이는 방식이다. 이는 깊은 신경망의 학습 신호를 보강하는 보조 분류기, 강화 학습의 보상 희소성 문제를 해결하는 비지도 보조 학습, 그리고 데이터 부족 문제를 해결하기 위한 생성적 보완 기술 등을 포괄한다.

배너 광고

보조 분류기

보조 분류기(Auxiliary Classifier)는 깊은 신경망의 중간 계층에 추가되는 작은 분류기이다. 신경망의 층이 깊어질수록 최종 출력에서 계산된 학습 신호가 앞쪽 레이어까지 충분히 전달되지 않는 경사 소실(Gradient Vanishing) 문제가 발생하기 쉽다.

보조 분류기는 네트워크 중간 지점에서 임시 예측을 수행하고 정답 기준의 손실(Loss)을 계산하여 경사(Gradient)를 앞쪽으로 직접 전달한다. 이를 통해 초반 레이어의 특징 학습을 돕고 전체적인 학습 안정성을 높이는 역할을 한다. 이는 마치 긴 시험의 중간에 체크포인트를 두어 학습 방향을 조기에 교정하는 것과 유사하다.

비지도 보조 학습

강화 학습 분야에서는 에이전트가 보상을 받기 어려운 환경에서 발생하는 '보상 희소성' 문제를 해결하기 위해 보조 작업을 활용한다. 에이전트가 최종 목표 외에도 환경의 변화를 이해하도록 돕는 추가적인 비지도 작업을 수행하게 함으로써 학습 신호를 보강한다.

모델특징
A3C비지도 보조 학습의 기초가 되는 에이전트 구조
UNREALA3C를 개선하여 보조 작업을 추가한 모델로, 보상 없이도 월드 표현을 학습함

UNREAL 에이전트는 자신의 액션이 환경의 픽셀값 변화에 어떤 영향을 미치는지 학습하는 등의 보조 작업을 통해 유용한 월드 표현을 습득한다. 이는 보상이 적은 상황에서도 에이전트가 환경을 더 빠르게 파악하도록 돕는다.

데이터 생성 및 성능 보완

레이블이 있는 데이터가 부족한 상황에서 비지도 학습을 활용해 지도 학습의 성능을 보완할 수 있다. 현실 세계의 데이터는 대부분 레이블이 없으므로, 비지도 학습을 통해 데이터의 특징을 추출하거나 새로운 레이블 샘플을 생성하여 훈련 데이터셋을 보강한다.

예를 들어, 레이블이 있는 데이터가 적은 환경에서 생성적 모델을 통해 새로운 샘플을 생성하고 이를 학습에 포함하면 전체적인 솔루션의 성능이 개선된다. 이는 지도 학습만으로는 충분하지 않은 데이터 희소성 문제를 극복하는 효과적인 방법이다.

추론 능력 및 신뢰성 강화

최근의 인공지능은 단순히 정답을 제시하는 것을 넘어 문제 해결의 중간 과정을 도출하는 추론 능력을 강화하고 있다. 기존 생성형 AI가 방대한 데이터를 바탕으로 확률적인 답을 내놓는 방식이었다면, 보완된 추론 AI는 문제를 여러 단계로 나누어 순차적으로 해결한다. 이러한 단계적 접근은 복잡한 계산이나 논리적 판단이 필요한 문제에서 오답의 위험을 줄이고 시스템의 신뢰성을 높이는 데 기여한다.

참고 자료

5
13.10.3 비지도 강화 및 보조 학습 - 딥러닝의 정석(2판) [Book]13.10.3 비지도 강화 및 보조 학습 - 딥러닝의 정석(2판) [Book]Skip to Content February 2024 Beginner to intermediate 428 pages 9h 40m Korean Content preview from딥러닝의 정석(2판) 418 딥러닝의 정석 2판 했다. A3C 에이…https://www.oreilly.com/library/view/dibreoningyi-jeongseog-2pan/9791169211925/chapter-179.htmlAuxiliary Classifier (보조 분류기) — 깊은 신경망에서 학습 신호를 중간에 보강하는 감독 구조 - Zero Math AIAuxiliary Classifier (보조 분류기) — 깊은 신경망에서 학습 신호를 중간에 보강하는 감독 구조 - Zero Math AI Auxiliary Classifier (보조 분류기)는 깊은신경망에서 최종 출력의 학습 신호만으로는 앞부분 레이어가 충분히 학습되지 않을 때, 중간 계층에 작은 분류기를 추가해 학습…https://zeromathai.com/auxiliary-classifier/11.7.2 비지도 학습과 지도 학습 솔루션 - 핸즈온 비지도 학습 [Book]11.7.2 비지도 학습과 지도 학습 솔루션 - 핸즈온 비지도 학습 [Book]Skip to Content July 2020 Beginner to intermediate 444 pages 10h 50m Korean Content preview from핸즈온 비지도 학습 363 11 장 DBN을 사용한 피처 추출 이러한…https://www.oreilly.com/library/view/haenjeuon-bijido-hagseub/9791162243190/chapter-200.htmlAuxiliary Classifier — A Supervision Mechanism That Reinforces Learning Signals Inside Deep Neural Networks - Zero Math AIAuxiliary Classifier — A Supervision Mechanism That Reinforces Learning Signals Inside Deep Neural Networks - Zero Math AI Auxiliary Classifier is a training mechanism that insert…https://zeromathai.com/en/auxiliary-classifier-en/딥러닝 기초 - part03. 지도학습/비지도학습/ 강화학습딥러닝 기초 - part03. 지도학습/비지도학습/ 강화학습 로그인 로그인 # 딥러닝 기초 - part03. 지도학습/비지도학습/ 강화학습 vinca·2022년 10월 25일 팔로우 1 ## 🌓 AI/DL - theory 목록 보기 3/24 ## 🎞Introduction 딥러닝과 머신러닝의 차이는 무엇일까? ###…https://velog.io/@rockwellvinca/%EB%94%A5%EB%9F%AC%EB%8B%9D-%EA%B8%B0%EC%B4%88-part03.-%EC%A7%80%EB%8F%84%ED%95%99%EC%8A%B5%EB%B9%84%EC%A7%80%EB%8F%84%ED%95%99%EC%8A%B5-%EA%B0%95%ED%99%94%ED%95%99%EC%8A%B5

관련 문서