챕터 4 정리 + Ch 5 예고
📌 이번 챕터 핵심
- 1962년 Anfinsen 실험: 변성된 단백질이 외부 도움 없이 정답 구조로 다시 접힘 → "서열이 구조를 결정한다" 증명 (1972 노벨상).
- Anfinsen 도그마: 정답 구조는 자유 에너지가 가장 낮은 구조. 원칙적으로 계산 가능해야 함.
- 1968년 Levinthal 역설: 무작위 탐색으로 정답 구조 찾기엔 우주 나이의 1017배 필요. 실제론 밀리초. → 단백질은 무작위가 아니라 깔때기 따라 접힘.
- 접근들: Ab initio(물리, 작은 단백질만), Homology(비슷한 템플릿 필요), Threading(알려진 fold만) — 셋 다 한계 명확.
- 1994년 CASP 시작: 객관적 평가의 등장. 22년간 점진적 발전 (GDT-TS ~30 → ~48).
- 2018 AlphaFold 1: 갑자기 ~58로 점프. 2020 AlphaFold 2: ~87 도달 — "문제 풀렸다" 선언.
📖 한 문단으로
"단백질 접힘 문제는 1962년 Anfinsen이 정의했고, 1968년 Levinthal이 그 어려움을 정량화했고, 1994년 CASP가 객관적 평가를 시작했다. 그 뒤 22년간 전통적 방법들은 점진적으로만 발전했다 — 평균 GDT-TS가 30에서 48로, 한 대회당 약 2점씩. 그런데 2018년 AlphaFold 1이 등장해 10점 점프. 2020년 AlphaFold 2가 다시 30점 점프해서 실험 정확도에 도달. 60년의 골치가 4년 만에 풀렸다."
🎯 왜 이 역사가 중요한가
알파폴드의 결과만 보면 "또 하나의 ML 성공 사례" 정도로 보일 수 있다. 그런데 이 챕터의 역사를 알고 보면 다르다.
- 22년간 한 대회당 2점씩 발전한 분야가 — 4년 만에 40점 점프
- "풀리지 않을 것"이라고 여겨졌던 문제가 풀림
- 같은 평가 시스템(CASP) 안에서 정직하게 검증됨 — 마케팅이 아니라 진짜 결과
이 무게를 알아야 다음 PART들이 의미 있다.
➡️ 다음 챕터 — AI의 등장
다음 챕터(Ch 5)는 PART 9의 마지막. 그리고 단백질 도메인의 마지막 도입.
- DeepMind 팀이 어떻게 이 문제에 발을 들였나 (알파고 직후의 결정)
- 2016년~2018년 — 외부에 거의 알려지지 않은 준비 기간
- 2018년 CASP13 — AlphaFold 1의 첫 등장
- 2위와의 격차 — 학계의 첫 반응
- CASP14를 향한 2년 — AlphaFold 2 준비
- 2020년 11월 — "문제가 풀렸다"는 선언의 순간
그리고 그 뒤로 PART 10이 시작 — 단백질 기초로 본격 진입.
📜 PART 9 Ch 4 완료 — 60년의 무게가 잡혔다
Anfinsen에서 CASP까지 — 단백질 접힘 문제의 역사를 따라갔다.
이제 그 문제를 푼 팀의 이야기로 — 다음 챕터.