20개의 글자 — 아미노산
단백질이 아미노산의 사슬이라고 했다. 이 아미노산이 정확히 무엇인지 한 발 더 들어가자.
📖 아미노산의 기본 구조
모든 아미노산은 같은 기본 골격을 공유한다.
- 중심 탄소(α-carbon) 하나
- 한쪽에는 아미노기 (-NH₂)
- 다른 쪽에는 카르복실기 (-COOH)
- 그리고 곁사슬(side chain, R) 하나 — 이게 아미노산마다 다른 부분
중심 탄소 + 두 작용기는 모든 아미노산이 같고, 곁사슬만 다르다. 이 곁사슬이 결국 아미노산의 "성격"을 결정.
🎯 곁사슬이 만드는 차이 — 그래서 20종
곁사슬에는 약 20가지 다른 모양이 있다. 그래서 아미노산이 20종.
곁사슬에 따라 아미노산의 성질이 결정된다:
- 소수성(hydrophobic): 물을 싫어함 — 단백질 안쪽에 모임. 예: Val, Leu, Ile
- 친수성(hydrophilic): 물을 좋아함 — 단백질 표면에 자리. 예: Ser, Thr, Asn
- 양전하(positive): Lys, Arg, His
- 음전하(negative): Asp, Glu
- 특수 형태: Pro(꺾임), Cys(이황화결합), Gly(가장 작음)
📖 20종 아미노산의 한 글자 코드
단백질 서열을 적을 때 보통 한 글자 코드를 쓴다. 알파폴드 입력이 정확히 이 글자열이다.
| A Ala (알라닌) | R Arg (아르기닌) | N Asn (아스파라긴) | D Asp (아스파르트산) |
| C Cys (시스테인) | E Glu (글루탐산) | Q Gln (글루타민) | G Gly (글리신) |
| H His (히스티딘) | I Ile (이소루신) | L Leu (루신) | K Lys (라이신) |
| M Met (메티오닌) | F Phe (페닐알라닌) | P Pro (프롤린) | S Ser (세린) |
| T Thr (트레오닌) | W Trp (트립토판) | Y Tyr (티로신) | V Val (발린) |
외울 필요 없다. "20종의 글자가 있다"는 것만 기억하면 충분.
💡 비유 — 단백질은 단어, 아미노산은 글자
영어 알파벳 26글자로 무수히 많은 단어를 만들 수 있는 것처럼, 아미노산 20글자로 무수히 많은 단백질을 만들 수 있다.
- 100글자 단백질 — 20100가지 가능한 서열 (실제로는 일부만 자연에 존재)
- 인간 단백질 평균 길이 — 약 380 글자
- 전 세계 모든 단백질 서열 데이터 — 약 2억 5천만 개 (UniProt)