1장에서 "3D 모양이 중요하다"고 했는데, 그럼 옛날 사람들은 도대체 어떻게 그 모양을 알아냈을까요?
답은 한 단어로 정리됩니다: 노가다.
2020년에 알파폴드가 나오기 전까지, 인류는 단백질 3D 구조를 알아내려고 한 단백질당 짧으면 몇 달, 길면 몇 년 ~ 몇십 년씩 매달렸습니다. 구조 하나 풀어내면 "사이언스" 같은 최상위 저널에 논문 한 편이 실렸어요. 지금 들으면 너무 비효율적인 것 같지만, 그게 진심으로 최선이었습니다.
X선 결정학 (X-ray Crystallography) — 50년 동안 표준이었던 방법
가장 많이 쓰인 방법이 X선 결정학이에요. 이름이 어려운데 원리는 의외로 직관적입니다.
풀어 쓰면 이렇습니다.
- 단백질을 결정 덩어리로 만든다. (단백질 분자가 규칙적으로 줄지어 박힌 알갱이)
- 그 결정에 X선을 쏜다.
- X선이 원자에 부딪혀 사방으로 흩어진다 → 검출기에 점 패턴(diffraction pattern)이 찍힌다.
- 그 점 패턴을 수학적으로 역산해서 원자의 3D 위치를 알아낸다.
왜 이게 노가다였을까?
원리는 깔끔한데, 실제로 하면 정말로 험난합니다. 단계별로 뭐가 어려운지 봅시다.
1단계: 단백질을 충분히 많이 얻기
일단 분석할 단백질이 한 줌은 있어야 합니다. 세포 안에 자연적으로 존재하는 양으로는 부족해요. 그래서 보통 대장균(E. coli) 같은 박테리아에 그 단백질의 유전자를 집어넣어서 대량 생산합니다. 이 과정 자체로 몇 주가 걸려요. 그리고 생산 안 되는 단백질도 많습니다.
2단계: 단백질을 결정으로 만들기 — 진짜 노가다
이게 X선 결정학의 최대 난관입니다. 단백질을 마치 소금 결정처럼 규칙적인 알갱이로 만들어야 해요. 단백질은 매우 큰 분자라서 결정을 만드는 게 쉽지 않습니다.
이 결정화 과정만 몇 개월에서 몇 년 걸리는 경우가 흔했습니다. 박사 학위 한 편이 "한 단백질의 결정 만들기"였던 시절도 있었어요.
3단계: X선 회절 실험 — 비싼 장비 필요
괜찮은 결정을 얻으면 이제 X선을 쏴야 합니다. 좋은 데이터를 얻으려면 일반 X선이 아니라 싱크로트론(synchrotron)이라는 거대한 가속기 시설에서 만든 강력한 X선이 필요해요. 이 시설은 전 세계에 몇십 개밖에 없고, 사용하려면 미리 예약하고 가야 합니다.
4단계: 데이터 분석 — 또 수개월
점 패턴을 가지고 원자의 3D 위치를 역산하는 게 단순하지 않습니다. "위상 문제(phase problem)"라는 골치 아픈 수학 문제가 있어서, 여러 추가 실험이나 트릭이 필요해요.
그 결과 — 한 단백질에 한 학위, 한 단백질에 한 논문
1958년, 최초로 X선 결정학으로 풀린 단백질이 등장합니다. 미오글로빈(myoglobin)이라는, 근육에 있는 작은 산소 운반 단백질이었어요. 존 켄드루(John Kendrew)가 약 12년에 걸쳐 풀어냈고, 1962년 노벨화학상을 받습니다.
이후 PDB(Protein Data Bank)라는 데이터베이스에 모든 풀린 단백질 구조가 올라가기 시작했어요. 2020년 알파폴드가 등장하기 전까지, PDB에는 약 17만 개의 단백질 구조가 쌓였습니다. 60년 동안 17만 개 — 1년에 약 2800개씩 풀어낸 셈이에요.
💭 그런데 단백질은 자연계에 얼마나 있을까?
인간 단백질만 약 2만 종류, 모든 생물의 단백질을 합치면 추정 2억 종류 이상이라고 합니다. 그런데 60년 동안 17만 개를 풀었어요. 전체의 1%도 안 된다는 뜻입니다. 이 페이스로 가면 모든 단백질 구조를 알아내는 데 수만 년이 걸릴 거예요. 이게 바로 컴퓨터로 예측해야 했던 절박한 이유입니다.
다른 방법들도 있긴 했지만…
X선 결정학 외에도 단백질 구조를 알아내는 방법이 몇 가지 더 개발됐습니다.
- NMR (핵자기공명): 작은 단백질에만 가능, 시간 오래 걸림
- Cryo-EM (저온전자현미경): 2010년대에 혁명적으로 발전, 결정 필요 없음, 하지만 여전히 비싸고 큰 단백질에 유리
이 방법들도 결국 "실험으로 직접 측정한다"는 공통점이 있어요. 값비싼 장비, 긴 시간, 큰 노력 — 같은 문제를 안고 있었습니다.
그래서 사람들은 점점 다른 길을 꿈꾸기 시작합니다.
이 꿈에 도전한 50년의 이야기가 다음 챕터입니다.
한 번 체크하고 가요
X선 결정학에서 가장 어렵고 시간이 오래 걸리는 단계는?
1958년에 X선 결정학으로 처음 3D 구조가 풀린 단백질은?
X선 결정학(기존 실험적 방법)의 한계는 무엇일까요?