시즌 2 · 알파폴드편 / PART 9 · PART 9 · 다리: 게임에서 과학으로 / Ch 4 · 50년의 미해결 문제 — Anfinsen에서 CASP까지

Anfinsen 도그마 — 그 함의

Anfinsen 실험에서 도출된 결론을 좀 더 정확하게 정리해보자.

📖 Anfinsen 도그마 (Thermodynamic Hypothesis)

"단백질의 정답 3D 구조는 아미노산 서열로 완전히 결정되며,
그것은 가능한 모든 구조 중 자유 에너지가 가장 낮은 구조다."

두 가지를 동시에 말한다.

  1. 구조는 서열의 함수다 (외부 정보 불필요)
  2. 그 구조는 에너지 최소 상태다 (왜 그 구조인지의 이유)
🎯 함의 1 — 계산 가능성

"구조가 서열의 함수다"라는 말은 — 원칙적으로 계산으로 풀 수 있다는 뜻이다.

  • 서열 입력 → 어떤 알고리즘 → 구조 출력
  • 외부 데이터(다른 단백질의 구조 등) 없이도 가능해야 한다
  • 이게 "단백질 접힘 문제(protein folding problem)"의 정확한 정의

그래서 "이 알고리즘을 찾자"가 곧 60년의 골치가 된다.

🎯 함의 2 — 물리학 기반 접근의 정당성

"에너지 최소"라는 말은 물리학적 접근이 가능하다는 뜻이다.

  • 가능한 모든 구조의 에너지를 계산
  • 가장 낮은 것을 찾는다 → 정답 구조

듣기엔 단순한데, 실제로 해보면 가능한 구조의 수가 천문학적이라 곧장 막힌다 — 다음 섹션 Levinthal 역설.

📖 도그마의 한계 — 정직하게

Anfinsen 도그마는 강력하지만 절대적이지는 않다.

  • 대형 단백질: 일부는 다른 단백질(샤페론)의 도움 없이는 못 접힘 — 서열만으로는 부족
  • 막 단백질: 세포막이라는 환경 자체가 접힘에 필요 — 서열 + 환경
  • 병적 응집: 어떤 서열은 두 가지 다른 안정 구조를 가질 수 있음 — 광우병 단백질이 그 예
  • 고유 비구조 단백질(IDP): 일부는 안정된 구조가 아예 없음 — 도그마 적용 안 됨

그래도 대다수의 단백질에 대해서는 Anfinsen 도그마가 성립. 알파폴드 같은 도구들도 이 도그마를 기본 전제로 한다.

💡 정리

1972년 Anfinsen 노벨상 시점에서 단백질 접힘 문제의 정의가 명확해졌다.

"서열을 알면 구조를 계산할 수 있어야 한다. 어떻게?"

그 답을 찾는 데 50년이 걸린다.