시즌 2 · 알파폴드편 / PART 9 · PART 9 · 다리: 게임에서 과학으로 / Ch 5 · AI의 등장 — DeepMind와 CASP13

두 CASP 사이 — Jumper 합류와 transformer

2018년 12월 CASP13. 2020년 11월 CASP14. 두 사이의 약 2년이 결정적이었다.

📖 DeepMind의 자기 평가 (2019년 초)

AlphaFold 1의 성공 + 한계가 명확해졌다.

  • 강점: 진화 데이터(MSA) 활용이 효과적
  • 강점: 거리 행렬 예측이 의미 있는 중간 표현
  • 약점: 거리 행렬에서 3D 구조로의 변환이 약함 (gradient descent로 후처리)
  • 약점: 곁사슬 디테일 부정확
  • 약점: 신경망 아키텍처가 sequence + structure를 충분히 통합 못함

전반적 결론 — "또 한번 점진적 개선이 아니라 근본적 재설계가 필요"

🎯 John Jumper 합류 (2017년 박사 후 합류, 2018~2019 본격 활동)

흥미로운 인물. 박사 후 진로 결정 중 우연히 DeepMind 채용공고를 봤다.

  • 화학 박사 (시카고 대학) — 분자 시뮬레이션과 물리화학 전문
  • 전통적 단백질 구조 연구 배경
  • 2017년 박사 마치고 DeepMind가 비밀리에 단백질 한다는 소문 듣고 지원
  • 처음에는 작은 역할로 합류 → CASP13 이후 핵심 역할

Jumper의 합류가 결정적이었다. DeepMind의 ML 전문성 + Jumper의 단백질 도메인 지식이 결합.

📖 두 가지 큰 결정 (2019)

2019년 중반, DeepMind 팀이 두 가지 큰 결정을 했다.

  1. 아키텍처 재설계: AlphaFold 1의 ResNet 기반을 버리고 Transformer 기반으로 전환. 2017년 발표된 Transformer가 자연어 처리에서 폭발적 성공을 보였고, 이를 단백질에도 적용.
  2. 3D 구조 직접 출력: 거리 행렬을 거치지 않고 원자 좌표를 직접 출력하는 모듈 설계. 이게 나중에 "Invariant Point Attention (IPA)"이 됨.

이 두 결정이 AlphaFold 2의 핵심 — 정확도 점프의 원인.

🎯 새 아키텍처 — 큰 그림 (PART 12에서 본격)

AlphaFold 2의 핵심 구성요소들 (대략):

  • Evoformer: MSA와 pair representation을 함께 처리하는 transformer 변형
  • Structure module: 잠재 표현에서 3D 좌표를 직접 출력
  • Invariant Point Attention (IPA): 3D 공간에서 attention을 정확히 표현
  • Recycling: 한 번 예측한 결과를 입력으로 다시 넣어 개선

각 구성요소가 어떻게 작동하는지는 PART 12에서 자세히 다룬다. 여기서는 이름과 큰 역할만 짚는다.

📖 학계의 진격 — 그러나 한 발 뒤

학계도 손 놓고 있지 않았다.

  • 여러 그룹이 딥러닝 기반 단백질 구조 예측에 본격 투자
  • David Baker의 RoseTTAFold도 비슷한 시기 개발 시작
  • Mohammed AlQuraishi의 RGN, Sergey Ovchinnikov의 trRosetta 등

다만 — DeepMind만큼의 컴퓨팅 자원과 ML 인프라가 부족. 2년이라는 짧은 기간에는 격차가 더 벌어졌다.

💡 정리 — 2년의 의미

2018년 12월 ~ 2020년 11월. 그 2년 동안:

  • DeepMind는 AlphaFold 1을 완전히 다시 설계 → AlphaFold 2 (GDT 58 → 92 점프 예고)
  • 학계 전체가 딥러닝 방향으로 재정렬
  • Transformer라는 새 도구가 단백질 도메인에 정착

그리고 2020년 11월, CASP14의 결과 발표 — 다음 섹션.