시즌 2 · 알파폴드편 / PART 9 · PART 9 · 다리: 게임에서 과학으로 / Ch 2 · 단백질 — 생명의 모든 기계

20개의 글자 — 아미노산

단백질이 아미노산의 사슬이라고 했다. 이 아미노산이 정확히 무엇인지 한 발 더 들어가자.

📖 아미노산의 기본 구조

모든 아미노산은 같은 기본 골격을 공유한다.

  • 중심 탄소(α-carbon) 하나
  • 한쪽에는 아미노기 (-NH₂)
  • 다른 쪽에는 카르복실기 (-COOH)
  • 그리고 곁사슬(side chain, R) 하나 — 이게 아미노산마다 다른 부분

중심 탄소 + 두 작용기는 모든 아미노산이 같고, 곁사슬만 다르다. 이 곁사슬이 결국 아미노산의 "성격"을 결정.

🎯 곁사슬이 만드는 차이 — 그래서 20종

곁사슬에는 약 20가지 다른 모양이 있다. 그래서 아미노산이 20종.

곁사슬에 따라 아미노산의 성질이 결정된다:

  • 소수성(hydrophobic): 물을 싫어함 — 단백질 안쪽에 모임. 예: Val, Leu, Ile
  • 친수성(hydrophilic): 물을 좋아함 — 단백질 표면에 자리. 예: Ser, Thr, Asn
  • 양전하(positive): Lys, Arg, His
  • 음전하(negative): Asp, Glu
  • 특수 형태: Pro(꺾임), Cys(이황화결합), Gly(가장 작음)
📖 20종 아미노산의 한 글자 코드

단백질 서열을 적을 때 보통 한 글자 코드를 쓴다. 알파폴드 입력이 정확히 이 글자열이다.

A Ala (알라닌)R Arg (아르기닌)N Asn (아스파라긴)D Asp (아스파르트산)
C Cys (시스테인)E Glu (글루탐산)Q Gln (글루타민)G Gly (글리신)
H His (히스티딘)I Ile (이소루신)L Leu (루신)K Lys (라이신)
M Met (메티오닌)F Phe (페닐알라닌)P Pro (프롤린)S Ser (세린)
T Thr (트레오닌)W Trp (트립토판)Y Tyr (티로신)V Val (발린)

외울 필요 없다. "20종의 글자가 있다"는 것만 기억하면 충분.

💡 비유 — 단백질은 단어, 아미노산은 글자

영어 알파벳 26글자로 무수히 많은 단어를 만들 수 있는 것처럼, 아미노산 20글자로 무수히 많은 단백질을 만들 수 있다.

  • 100글자 단백질 — 20100가지 가능한 서열 (실제로는 일부만 자연에 존재)
  • 인간 단백질 평균 길이 — 약 380 글자
  • 전 세계 모든 단백질 서열 데이터 — 약 2억 5천만 개 (UniProt)