CHAPTER 02 역사 ⏱ 약 10분

🔬 옛날엔 어떻게 단백질 모양을 알아냈을까?

X선 결정학 — 노가다와 인내의 시대

📋이전 챕터에서 뭐 했죠?

제1장 — 단백질, 1분 복습

단백질이 아미노산 20종으로 만들어진 사슬이고, 4단계 구조(1차-2차-3차-4차)로 정리된다는 걸 봤어요. 그리고 핵심: "모양이 곧 기능" — 단백질의 3D 모양을 알면 그 단백질이 뭘 할지 알 수 있습니다.

1장에서 "3D 모양이 중요하다"고 했는데, 그럼 옛날 사람들은 도대체 어떻게 그 모양을 알아냈을까요?

답은 한 단어로 정리됩니다: 노가다.

2020년에 알파폴드가 나오기 전까지, 인류는 단백질 3D 구조를 알아내려고 한 단백질당 짧으면 몇 달, 길면 몇 년 ~ 몇십 년씩 매달렸습니다. 구조 하나 풀어내면 "사이언스" 같은 최상위 저널에 논문 한 편이 실렸어요. 지금 들으면 너무 비효율적인 것 같지만, 그게 진심으로 최선이었습니다.

X선 결정학 (X-ray Crystallography) — 50년 동안 표준이었던 방법

가장 많이 쓰인 방법이 X선 결정학이에요. 이름이 어려운데 원리는 의외로 직관적입니다.

X선 결정학 단백질을 결정(crystal)으로 만들어 X선을 쏘면, 결정 안의 원자들에 부딪힌 X선이 일정한 패턴으로 흩어진다. 그 흩어진 패턴(diffraction pattern)을 분석하면 원자들의 위치를 역산할 수 있다.

풀어 쓰면 이렇습니다.

  1. 단백질을 결정 덩어리로 만든다. (단백질 분자가 규칙적으로 줄지어 박힌 알갱이)
  2. 그 결정에 X선을 쏜다.
  3. X선이 원자에 부딪혀 사방으로 흩어진다 → 검출기에 점 패턴(diffraction pattern)이 찍힌다.
  4. 그 점 패턴을 수학적으로 역산해서 원자의 3D 위치를 알아낸다.
X선 소스 (싱크로트론) X선 단백질 결정 (이걸 만드는 게 제일 어려움) 검출기 (점 패턴) 3D 구조 (수학적 역산)
X선 결정학의 큰 그림 — 결정에 X선을 쏘고, 흩어진 패턴을 역산해서 3D 구조를 얻는다

왜 이게 노가다였을까?

원리는 깔끔한데, 실제로 하면 정말로 험난합니다. 단계별로 뭐가 어려운지 봅시다.

1단계: 단백질을 충분히 많이 얻기

일단 분석할 단백질이 한 줌은 있어야 합니다. 세포 안에 자연적으로 존재하는 양으로는 부족해요. 그래서 보통 대장균(E. coli) 같은 박테리아에 그 단백질의 유전자를 집어넣어서 대량 생산합니다. 이 과정 자체로 몇 주가 걸려요. 그리고 생산 안 되는 단백질도 많습니다.

2단계: 단백질을 결정으로 만들기 — 진짜 노가다

이게 X선 결정학의 최대 난관입니다. 단백질을 마치 소금 결정처럼 규칙적인 알갱이로 만들어야 해요. 단백질은 매우 큰 분자라서 결정을 만드는 게 쉽지 않습니다.

⚠️
결정을 만들기 위해 시도하는 조건: 온도, pH, 염 농도, 침전제 종류, 단백질 농도, 첨가제 종류… 수백 개의 조건을 하나하나 시도해보면서 "운 좋게" 결정이 자라는 조건을 찾아야 합니다. 어떤 단백질은 영영 결정이 안 자라서 X선 결정학으로는 풀 수 없어요.

이 결정화 과정만 몇 개월에서 몇 년 걸리는 경우가 흔했습니다. 박사 학위 한 편이 "한 단백질의 결정 만들기"였던 시절도 있었어요.

3단계: X선 회절 실험 — 비싼 장비 필요

괜찮은 결정을 얻으면 이제 X선을 쏴야 합니다. 좋은 데이터를 얻으려면 일반 X선이 아니라 싱크로트론(synchrotron)이라는 거대한 가속기 시설에서 만든 강력한 X선이 필요해요. 이 시설은 전 세계에 몇십 개밖에 없고, 사용하려면 미리 예약하고 가야 합니다.

4단계: 데이터 분석 — 또 수개월

점 패턴을 가지고 원자의 3D 위치를 역산하는 게 단순하지 않습니다. "위상 문제(phase problem)"라는 골치 아픈 수학 문제가 있어서, 여러 추가 실험이나 트릭이 필요해요.

그 결과 — 한 단백질에 한 학위, 한 단백질에 한 논문

1958년, 최초로 X선 결정학으로 풀린 단백질이 등장합니다. 미오글로빈(myoglobin)이라는, 근육에 있는 작은 산소 운반 단백질이었어요. 존 켄드루(John Kendrew)가 약 12년에 걸쳐 풀어냈고, 1962년 노벨화학상을 받습니다.

📜
역사적 의미: 미오글로빈은 인류가 처음으로 본 단백질의 3차원 모양이었습니다. 이전까지는 그저 "어떤 큰 분자가 있다"는 것만 알았지, 모양을 본 적이 없었어요. 아미노산 153개짜리 작은 단백질을 푸는 데 12년이 걸린 셈입니다.

이후 PDB(Protein Data Bank)라는 데이터베이스에 모든 풀린 단백질 구조가 올라가기 시작했어요. 2020년 알파폴드가 등장하기 전까지, PDB에는 약 17만 개의 단백질 구조가 쌓였습니다. 60년 동안 17만 개 — 1년에 약 2800개씩 풀어낸 셈이에요.

💭 그런데 단백질은 자연계에 얼마나 있을까?

인간 단백질만 약 2만 종류, 모든 생물의 단백질을 합치면 추정 2억 종류 이상이라고 합니다. 그런데 60년 동안 17만 개를 풀었어요. 전체의 1%도 안 된다는 뜻입니다. 이 페이스로 가면 모든 단백질 구조를 알아내는 데 수만 년이 걸릴 거예요. 이게 바로 컴퓨터로 예측해야 했던 절박한 이유입니다.

다른 방법들도 있긴 했지만…

X선 결정학 외에도 단백질 구조를 알아내는 방법이 몇 가지 더 개발됐습니다.

  • NMR (핵자기공명): 작은 단백질에만 가능, 시간 오래 걸림
  • Cryo-EM (저온전자현미경): 2010년대에 혁명적으로 발전, 결정 필요 없음, 하지만 여전히 비싸고 큰 단백질에 유리

이 방법들도 결국 "실험으로 직접 측정한다"는 공통점이 있어요. 값비싼 장비, 긴 시간, 큰 노력 — 같은 문제를 안고 있었습니다.

그래서 사람들은 점점 다른 길을 꿈꾸기 시작합니다.

🌟
"아미노산 순서만 알면, 컴퓨터로 3D 모양을 예측할 수 있지 않을까?"

이 꿈에 도전한 50년의 이야기가 다음 챕터입니다.

한 번 체크하고 가요

체크 1/3 Q1.

X선 결정학에서 가장 어렵고 시간이 오래 걸리는 단계는?

체크 2/3 Q2.

1958년에 X선 결정학으로 처음 3D 구조가 풀린 단백질은?

체크 3/3 Q3.

X선 결정학(기존 실험적 방법)의 한계는 무엇일까요?

다음 챕터로 가기 전에

이제 컴퓨터로 풀려고 한 50년의 이야기로 가요

실험이 너무 느리고 비싸다는 걸 알았으니, 이제 사람들이 왜 컴퓨터로 풀려고 했는지, 그리고 왜 그게 50년이나 안 풀렸는지를 봅시다. 다음 챕터엔 CASP라는 2년마다 열리는 단백질 구조 예측 대회가 등장합니다.