단백질 구조 예측은 아미노산의 1차 서열로부터 단백질의 2차, 3차, 4차 구조를 추정하는 과정이다. 단백질의 입체 구조는 그 기능을 결정하는 핵심 요소로, 이를 파악하는 것은 신약 개발, 효소 설계, 질병 기전 이해 등 생명공학 전반에서 매우 중요하다. 전통적으로는 X선 결정학이나 극저온 전자현미경 등을 이용해 실험적으로 구조를 규명했으나, 막대한 비용과 시간이 소요되는 한계가 있었다. 이를 극복하기 위해 계산 과학적 접근이 시도되어 왔으며, 최근 구글 딥마인드의 알파폴드와 같은 인공지능 기술의 도입으로 예측 정확도가 비약적으로 향상되었다.

배너 광고

개요

단백질 구조 예측은 단백질을 구성하는 아미노산 서열 정보를 통해 해당 단백질이 실제 생체 내에서 어떤 3차원 형태를 갖는지 알아내는 과정이다. 단백질은 아미노산 사슬이 특정 방식으로 접히면서 고유한 입체 구조를 형성하며, 이 구조에 따라 생물학적 기능이 결정된다. 이는 새로운 단백질을 설계하는 '단백질 디자인'과는 구별되는 개념으로, 이미 존재하는 서열의 구조를 밝히는 데 집중한다. 생물정보학 및 이론화학 분야에서 가장 중요한 목표 중 하나로 꼽힌다.

단백질의 복잡한 3차원 입체 구조 모델
아미노산 서열이 접혀 형성된 단백질의 3차원 구조 예시구글 딥마인드, 단백질의 비밀 어떻게 풀었나 - ZDNet korea

주요 예측 방법

예측 방식은 기존에 알려진 데이터의 활용 여부에 따라 크게 세 가지로 분류된다.

방법론특징
상동성 모델링서열이 유사한 다른 단백질의 이미 알려진 구조를 템플릿으로 삼아 구조를 예측한다.
단백질 쓰레딩서열 유사성이 낮더라도 알려진 단백질 구조 골격에 서열을 맞추어 보며 가장 적합한 구조를 찾는다.
Ab initio 예측기존 데이터 없이 물리적 원리와 열역학적 안정성만을 계산하여 구조를 처음부터 예측한다.

CASP와 기술 평가

단백질 구조 예측 기술의 발전 정도를 평가하기 위해 2년마다 CASP(Critical Assessment of protein Structure Prediction)라는 대회가 열린다. 이 대회는 실험적으로는 구조가 밝혀졌으나 아직 공개되지 않은 단백질의 서열을 연구자들에게 제공하고, 그 구조를 얼마나 정확하게 예측하는지 겨루는 방식으로 진행된다. 이를 통해 전 세계 연구팀의 예측 알고리즘 성능이 객관적으로 검증된다.

인공지능의 도입과 알파폴드

2018년 구글 딥마인드(DeepMind)가 개발한 **알파폴드(AlphaFold)**가 CASP에 등장하면서 구조 예측 분야에 혁신이 일어났다. 알파폴드는 딥러닝 기술을 활용하여 아미노산 간의 거리를 예측하고 이를 바탕으로 최적의 모델을 도출한다.

  • 알파폴드1: 2018년 CASP13에서 압도적인 성적으로 1위를 차지하며 AI의 가능성을 증명하였다.
  • 알파폴드2: 2020년 CASP14에서 90점 이상의 정확도(GDT)를 기록하며, 실험적 규명 방식에 근접하는 수준의 예측 성능을 보여주었다.

이는 수십 년간 생물학계의 난제였던 '단백질 접힘 문제(protein folding problem)'를 사실상 해결한 것으로 평가받는다.

응용 및 한계

주요 응용 분야

구조 예측 기술은 신약 개발 시 약물 후보 물질이 단백질과 결합하는 방식을 분석하거나, 특정 질병의 원인이 되는 단백질 변이를 연구하는 데 필수적이다. 또한 산업적으로 유용한 신규 효소를 설계하는 데에도 기여한다.

기술적 한계

여전히 해결해야 할 과제들이 존재한다.

  1. 복합체 구조: 여러 단백질이 결합한 복합체 구조의 예측.
  2. 막 단백질: 세포막에 존재하는 단백질의 특수성.
  3. 비정형 영역: 고정된 형태가 없는 영역의 처리.
  4. 동역학적 변화: 단백질의 정적인 구조 외에 시간에 따른 움직임 예측.

참고 자료

5
단백질 구조 예측단백질 구조 예측단백질의 2차 구조, 3차 구조, 4차 구조를 예측하기 위해 구성아미노산을 분석 할 수 있다. 단백질 구조 예측(蛋白質構造豫測,영어: protein structure prediction)은아미노산서열로부터단백질의 3차원 구조, 즉단백질 접힘,단백질의 1차 구조으로부터 단백질의 2차 구조, 3차 구조, 4…https://ko.wikipedia.org/wiki/%EB%8B%A8%EB%B0%B1%EC%A7%88_%EA%B5%AC%EC%A1%B0_%EC%98%88%EC%B8%A1scienceon.kisti.re.krURL : https://scienceon.kisti.re.kr/aiq/issue/selectIssueReportView.do?searchIssueRptNo=219 2024-10-15 단백질 구조 예측 #Protein Structure Prediction #Bioinformatics #Protein secondary s…https://scienceon.kisti.re.kr/aiq/issue/downloadPDF.do;jsessionid=C545A502EB05E49CB86D0C2C9CB6EE1F.scienceon_left?searchIssueRptNo=219구글 딥마인드, 단백질의 비밀 어떻게 풀었나 - ZDNet korea구글 딥마인드, 단백질의 비밀 어떻게 풀었나 - ZDNet korea # 구글 딥마인드, 단백질의 비밀 어떻게 풀었나 딥러닝 활용…아미노산 거리 계산→합의된 모델 도출 김익현 미디어연구소장기자 페이지 구독기자의 다른기사 보기 단백질은 3차원 구조로 다양한 모양을 형성한다. 이것을 단백질 접힘(protein folding…https://zdnet.co.kr/view/?no=20201201165653[보고서]단백질의 구조 및 기능 예측을 위한 Deep Learning 모델 개발 및 그 응용[보고서]단백질의 구조 및 기능 예측을 위한 Deep Learning 모델 개발 및 그 응용 $\require{mediawiki-texvc}$ 처리 중 논문 분석 리뷰 생성 질문 생성 완료 실패 (성공적으로 완료되었습니다) (분석중 오류가 발생했습니다) 논문리뷰 보기 닫기 한번의 인증절차만으로NTIS, DataON, E…https://scienceon.kisti.re.kr/srch/selectPORSrchReport.do?cn=TRKO202200016169과학기술 지식인프라 ScienceON (사이언스온) - ScienceON TREND과학기술 지식인프라 ScienceON (사이언스온) - ScienceON TREND 한번의 인증절차만으로NTIS, DataON, EDISON,KAFE 등의 서비스 이용이가능합니다. # 연합인증 연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인…https://scienceon.kisti.re.kr/aiq/issue/selectIssueReportView.do?searchIssueRptNo=219

관련 문서