시즌 2 · 알파폴드편 / PART 10 · 단백질 기초 — 아미노산에서 3차 구조까지 / Ch 1 · 아미노산 20글자 — 단백질의 알파벳

Hydrophobicity — 구조의 가장 큰 동력

여러 카테고리 중 단백질 구조에 가장 큰 영향을 주는 것 — 소수성/친수성의 대비.

📖 소수성 효과 (Hydrophobic effect)

단백질을 물에 넣으면 무슨 일이 일어나나?

  1. 처음에는 풀어진 사슬 형태
  2. 물 분자가 소수성 잔기 주변에서 정렬됨 (엔트로피 감소)
  3. 이게 에너지적으로 불리 → 소수성 잔기들이 모이려는 경향
  4. 결국 소수성 잔기들이 안쪽으로 모이고 친수성이 표면에 → 단백질 접힘

"기름방울이 물에서 동그랗게 뭉치는 것"과 정확히 같은 원리. 단백질 접힘의 가장 큰 동력.

🎯 측정 — Hydrophobicity scale

각 아미노산이 얼마나 소수성/친수성인지를 정량화한 척도들이 있다. 가장 유명한 것 — Kyte-Doolittle (KD) scale (1982).

  • 매우 소수성: Ile(+4.5), Val(+4.2), Leu(+3.8), Phe(+2.8), Cys(+2.5), Met(+1.9), Ala(+1.8)
  • 중간: Gly(-0.4), Thr(-0.7), Ser(-0.8), Trp(-0.9), Tyr(-1.3), Pro(-1.6)
  • 매우 친수성: His(-3.2), Glu(-3.5), Gln(-3.5), Asp(-3.5), Asn(-3.5), Lys(-3.9), Arg(-4.5)

참고로 Trp는 소수성 카테고리지만 KD 값은 약간 음수 — 방향족 + 큰 크기 때문에 미묘함. 카테고리 분류와 정확한 수치는 살짝 다를 수 있다.

📖 응용 — 막 단백질 검출

Hydrophobicity scale의 가장 흔한 실용 — "이 단백질이 막을 가로지르나?" 예측.

  • 막 단백질은 세포막(지질) 안에 박혀 있음
  • 지질 환경은 매우 소수성
  • 그래서 막을 가로지르는 부분(transmembrane helix)은 약 20개 연속 소수성 잔기로 이루어짐
  • 서열을 따라 20-residue window의 평균 KD 값을 그래프로 그리면 — 막 통과 영역이 봉우리로 나타남
  • 이게 "1차 구조에서 구조 단서를 뽑는" 가장 단순한 예
🎯 단백질 코어 vs 표면

수용성 단백질(물에 녹는 단백질, 대부분의 단백질)에서도 비슷한 패턴.

  • 코어 (안쪽): 소수성 잔기 풍부 (Leu, Ile, Val, Phe 등)
  • 표면 (바깥): 친수성 / 전하 잔기 (Lys, Arg, Asp, Glu, Ser, Thr 등)

그래서 단백질 서열만 봐도 — "이 잔기가 안쪽일 가능성이 높다 / 표면일 가능성이 높다"의 추측이 어느 정도 가능.

알파폴드의 신경망도 이런 패턴을 학습한다 — 명시적으로 배우진 않지만 결과적으로 안쪽/표면을 정확히 가른다.

💡 정리 — 한 잔기, 큰 영향

아미노산 하나의 hydrophobicity가 단백질 전체의 모양과 위치를 결정할 수 있다.

  • 막 단백질 → 단백질이 세포의 어디에 위치하는가
  • 코어 vs 표면 → 단백질의 3D 모양
  • 변이 시 효과 → 친수성을 소수성으로 바꾸면 큰 구조 변화 (낫적혈구병이 정확히 그 사례)

그래서 알파폴드 입력의 첫 줄(아미노산 서열)이 그렇게 많은 정보를 담고 있다 — 다음 섹션에서 직접 코드로 확인.