이번 챕터는 단백질 구조 예측의 "역사가 한 번 바뀐 순간"입니다. 2020년 11월 30일, 알파폴드 2세대(AlphaFold2)가 CASP14에서 결과를 발표했어요. 그 자리에 있던 사람들의 얼굴이 지금도 인터넷에 남아있을 정도로, 압도적이었습니다.
2020년 CASP14 — 게임 끝
딥마인드의 알파폴드2가 들고 온 GDT_TS 평균 점수는 약 92점이었습니다. "평균 92점"이라는 뜻은 쉬운 단백질도, 어려운 단백질도 거의 다 90점 이상으로 풀었다는 뜻이에요.
다른 팀들과의 차이
다른 모든 팀들의 평균 점수가 약 75점 근처였어요. 알파폴드2는 거기서 17점이나 위에 있었습니다. GDT 점수에서 17점 차이는 학계에서 "세대 차이"로 표현됩니다. 같은 시대의 기술이 아닌 거예요.
학계의 반응 — "Game has changed"
CASP를 진행하는 학자 존 몰트(John Moult)가 결과 발표 후 했던 말이 유명합니다.
50년 만에 사실상 풀린 문제. 그 자리에 있던 단백질 학자들은 자기 직업이 사라지는 게 아닌가 농담할 정도였어요. 한 학자는 트위터에 "이거 보고 박사 과정 학생들에게 뭐라고 말해야 할지 모르겠다"라고 적었습니다.
알파폴드2는 누가 만들었나? — 딥마인드(DeepMind)
딥마인드는 영국 런던의 AI 회사예요. 2010년에 데미스 허사비스(Demis Hassabis), 셰인 레그(Shane Legg), 무스타파 술레이만(Mustafa Suleyman) 세 명이 창업했고, 2014년에 구글이 약 4억 달러에 인수했습니다.
딥마인드는 그 전에 이미 유명한 일을 두 번 해냈어요.
- 2013년: 비디오 게임을 사람보다 잘하는 AI(DQN) 발표
- 2016년: 알파고(AlphaGo)로 이세돌 9단을 4:1로 이김
그리고 2020년에 단백질 구조 예측에서 50년 난제를 해결한 거예요. 이쯤 되면 한 분야씩 골라가며 게임을 끝내는 회사라고 봐도 무방합니다.
알파폴드2가 한 일을 한 줄로 정리하면
🎯 핵심
아미노산 시퀀스 → 컴퓨터에 넣으면 → 3D 좌표가 나온다.
그것도 실험과 거의 같은 정확도로. 그것도 몇 시간 안에.
옛날엔 한 단백질에 몇 년 걸리던 일이 클릭 한 번으로 끝나게 된 겁니다.
그 다음 일어난 일들
2021년: 알파폴드2 오픈소스 + AlphaFold DB 공개
딥마인드는 알파폴드2의 코드와 모델을 무료로 공개합니다. 누구나 쓸 수 있게요. 그리고 AlphaFold Protein Structure Database도 공개합니다. 인간 단백질 약 2만 개를 포함해, 인류가 알고 있는 거의 모든 단백질의 예측 구조를 한곳에 모았어요. 지금은 약 2억 개의 구조가 들어있습니다.
2022~2023년: 알파폴드 후예들 우후죽순
오픈소스로 풀린 덕분에 다른 연구팀들도 비슷한 시스템을 만들기 시작합니다. 바로 그중 하나가 로제타폴드(RoseTTAFold)예요. 우리가 이 웹북에서 주로 다룰 그 친구입니다.
2024년: 노벨화학상
2024년 노벨화학상이 알파폴드 관련해서 수여됩니다.
- 데미스 허사비스(Demis Hassabis) — 딥마인드 CEO
- 존 점퍼(John Jumper) — 알파폴드2 프로젝트 리더
- 데이비드 베이커(David Baker) — 로제타폴드 만든 사람 (다음 챕터의 주인공!)
50년 난제를 푼 공로로 셋이 같이 받았어요. 그리고 데이비드 베이커가 끼어 있는 이유가 바로 로제타폴드 때문입니다.
그런데 알파폴드만 있는 줄 알았는데, 왜 로제타폴드도?
좋은 질문이에요. 알파폴드2가 2020년 11월에 발표됐을 때, 모든 사람이 "이제 끝이다"라고 생각했어요. 근데 그게 다가 아니었습니다.
딥마인드는 알파폴드2의 정확한 구조를 한동안 공개하지 않았어요. 연구자들은 발표된 논문의 큰 그림만 보고 "그거 우리도 비슷하게 만들 수 있나?" 시도하기 시작했습니다.
그 도전에 가장 빠르게 성공한 팀이 미국 워싱턴 대학의 데이비드 베이커 연구실이었어요. 그리고 그게 다음 챕터의 이야기, 로제타폴드입니다.
한 번 체크하고 가요
알파폴드2의 2020년 CASP14 GDT_TS 평균 점수는 약 얼마였을까요?
알파폴드를 만든 회사는?
알파폴드의 가장 큰 의미는?