단백질 구조 예측은 아미노산의 1차 서열로부터 단백질의 2차, 3차, 4차 구조를 추정하는 과정이다. 단백질의 입체 구조는 그 기능을 결정하는 핵심 요소로, 이를 파악하는 것은 신약 개발, 효소 설계, 질병 기전 이해 등 생명공학 전반에서 매우 중요하다. 전통적으로는 X선 결정학이나 극저온 전자현미경 등을 이용해 실험적으로 구조를 규명했으나, 막대한 비용과 시간이 소요되는 한계가 있었다. 이를 극복하기 위해 계산 과학적 접근이 시도되어 왔으며, 최근 구글 딥마인드의 알파폴드와 같은 인공지능 기술의 도입으로 예측 정확도가 비약적으로 향상되었다.

배너 광고

개요

단백질 구조 예측은 단백질을 구성하는 아미노산 서열 정보를 통해 해당 단백질이 실제 생체 내에서 어떤 3차원 형태를 갖는지 알아내는 과정이다. 단백질은 아미노산 사열이 특정 방식으로 접히면서 고유한 입체 구조를 형성하며, 이 구조에 따라 생물학적 기능이 결정된다. 이는 새로운 단백질을 설계하는 '단백질 디자인'과는 구별되는 개념으로, 이미 존재하는 서열의 구조를 밝히는 데 집중한다.

주요 예측 방법

예측 방식은 기존에 알려진 데이터의 활용 여부에 따라 크게 세 가지로 분류된다.

  • 상동성 모델링(Homology Modeling): 서열이 유사한 다른 단백질의 이미 알려진 구조를 템플릿으로 삼아 구조를 예측하는 방법이다.
  • 단백질 쓰레딩(Protein Threading): 서열 유사성이 낮더라도 알려진 단백질 구조 골격에 서열을 맞추어 보며 가장 적합한 구조를 찾는 방식이다.
  • Ab initio 예측: 기존 데이터 없이 물리적 원리와 열역학적 안정성만을 계산하여 구조를 처음부터 예측하는 방법이다.

CASP와 기술 평가

단백질 구조 예측 기술의 발전 정도를 평가하기 위해 2년마다 CASP(Critical Assessment of protein Structure Prediction)라는 대회가 열린다. 이 대회는 실험적으로는 구조가 밝혀졌으나 아직 공개되지 않은 단백질의 서열을 연구자들에게 제공하고, 그 구조를 얼마나 정확하게 예측하는지 겨루는 방식으로 진행된다. 이를 통해 전 세계 연구팀의 예측 알고리즘 성능이 객관적으로 검증된다.

인공지능의 도입과 알파폴드

2018년 구글 딥마인드(DeepMind)가 개발한 **알파폴드(AlphaFold)**가 CASP에 등장하면서 구조 예측 분야에 혁신이 일어났다. 알파폴드는 딥러닝 기술을 활용하여 아미노산 간의 거리를 예측하고 이를 바탕으로 최적의 모델을 도출한다.

  1. 알파폴드1: 2018년 CASP13에서 압도적인 성적으로 1위를 차지하며 AI의 가능성을 증명하였다.
  2. 알파폴드2: 2020년 CASP14에서 90점 이상의 정확도(GDT)를 기록하며, 실험적 규명 방식에 근접하는 수준의 예측 성능을 보여주었다. 이는 수십 년간 생물학계의 난제였던 '단백질 접힘 문제'를 사실상 해결한 것으로 평가받는다.
신경망을 이용한 단백질 구조 예측 프로세스 다이어그램
아미노산 서열과 데이터베이스 정보를 신경망에 입력하여 거리와 각도를 예측하고 최종 구조를 도출하는 과정구글 딥마인드, 단백질의 비밀 어떻게 풀었나 - ZDNet korea

응용 및 한계

구조 예측 기술은 신약 개발 시 약물 후보 물질이 단백질과 결합하는 방식을 분석하거나, 특정 질병의 원인이 되는 단백질 변이를 연구하는 데 필수적이다. 또한 산업적으로 유용한 신규 효소를 설계하는 데에도 기여한다.

다만, 여전히 한계점은 존재한다. 여러 단백질이 결합한 복합체 구조, 세포막에 존재하는 막 단백질, 고정된 형태가 없는 비정형 영역 등은 여전히 예측이 까다로운 영역으로 남아 있다. 또한 단백질의 정적인 구조 외에 시간에 따른 동역학적 변화를 예측하는 것도 향후 과제이다.

참고 자료

6
단백질 구조 예측단백질 구조 예측단백질의 2차 구조, 3차 구조, 4차 구조를 예측하기 위해 구성아미노산을 분석 할 수 있다. 단백질 구조 예측(蛋白質構造豫測,영어: protein structure prediction)은아미노산서열로부터단백질의 3차원 구조, 즉단백질 접힘,단백질의 1차 구조으로부터 단백질의 2차 구조, 3차 구조, 4…https://ko.wikipedia.org/wiki/%EB%8B%A8%EB%B0%B1%EC%A7%88_%EA%B5%AC%EC%A1%B0_%EC%98%88%EC%B8%A1scienceon.kisti.re.krURL : https://scienceon.kisti.re.kr/aiq/issue/selectIssueReportView.do?searchIssueRptNo=219 2024-10-15 단백질 구조 예측 #Protein Structure Prediction #Bioinformatics #Protein secondary s…https://scienceon.kisti.re.kr/aiq/issue/downloadPDF.do;jsessionid=C545A502EB05E49CB86D0C2C9CB6EE1F.scienceon_left?searchIssueRptNo=219구글 딥마인드, 단백질의 비밀 어떻게 풀었나 - ZDNet korea구글 딥마인드, 단백질의 비밀 어떻게 풀었나 - ZDNet korea # 구글 딥마인드, 단백질의 비밀 어떻게 풀었나 딥러닝 활용…아미노산 거리 계산→합의된 모델 도출 김익현 미디어연구소장기자 페이지 구독기자의 다른기사 보기 단백질은 3차원 구조로 다양한 모양을 형성한다. 이것을 단백질 접힘(protein folding…https://zdnet.co.kr/view/?no=20201201165653생물학 혁신, 단백질 구조 예측하는 인공지능의 시대 : KISTI의 과학향기생물학 혁신, 단백질 구조 예측하는 인공지능의 시대 : KISTI의 과학향기 ## 스토리 ### 생물학 혁신, 단백질 구조 예측하는 인공지능의 시대 제3676호 2021년 08월 30일 과학에서 위대한 발견은 탁월한 방법과 엄청난 집념을 거름 삼아 탄생한다. 그리고 그 과정 속에는 사람들의 희망과 감동, 불안과 우려가…https://scent.kisti.re.kr/site/main/archive/article/%EC%83%9D%EB%AC%BC%ED%95%99-%ED%98%81%EC%8B%A0-%EB%8B%A8%EB%B0%B1%EC%A7%88-%EA%B5%AC%EC%A1%B0-%EC%98%88%EC%B8%A1%ED%95%98%EB%8A%94-%EC%9D%B8%EA%B3%B5%EC%A7%80%EB%8A%A5%EC%9D%98-%EC%8B%9C%EB%8C%80Home - Prediction CenterHome - Prediction Center | Protein Structure Prediction Center | | --- | | Menu | | --- | | assemblymodeling | template-basedmodeling | ab initiomodeling | contactprediction | hel…https://pinot3.genomecenter.ucdavis.edu/단백질 구조 예측 기술 동향 (KISTI)단백질 구조 예측의 전반적인 기술 및 딥러닝 적용 사례 수록https://scienceon.kisti.re.kr/aiq/issue/selectIssueReportView.do?searchIssueRptNo=219

관련 문서