PART 10 시작 — 단백질의 알파벳
🎬 PART 9 종료 후 — 본격 진입
PART 9에서 우리는 "왜"를 잡았다. 왜 단백질 문제고, 왜 그게 50년 묵었고, 왜 DeepMind가 풀었나.
이제 PART 10부터는 "무엇"으로 옮긴다. 단백질 자체를 자세히 — 그 뒤에 PART 11부터 본격 알고리즘.
🎯 PART 10의 큰 그림 (6 챕터)
- Ch 1 (지금): 아미노산 20글자 — 단백질의 알파벳
- Ch 2: 펩티드 결합과 2차 구조 — α-나선, β-주름
- Ch 3: 3차 구조 — 도메인, fold, motif
- Ch 4: MSA — 진화 정보가 곧 구조 단서 (알파폴드 입력의 핵심)
- Ch 5: 실험 구조 결정 — X-ray, NMR, Cryo-EM
- Ch 6: PDB와 데이터베이스 — 단백질 구조 데이터의 세계
PART 10이 끝나면 단백질 어휘가 충분히 잡혀서 PART 11(AlphaFold 1)로 자연스럽게 들어갈 수 있다.
📖 이번 챕터(Ch 1)의 14단계
- 아미노산의 기본 구조 — 모든 아미노산이 공유하는 것
- 왜 정확히 20종인가
- 4가지 카테고리로 분류하기
- 소수성 아미노산 9종 — Val/Leu/Ile/Met/Phe/Trp/Pro/Ala/Gly
- 극성 무전하 6종 — Ser/Thr/Cys/Asn/Gln/Tyr
- 양전하 3종 — Lys/Arg/His
- 음전하 2종 — Asp/Glu
- 특수 3종 자세히 — Gly(가장 작음), Pro(꺾임), Cys(이황화결합)
- 한 글자 코드 — 외우는 방법과 패턴
- Hydrophobicity의 구조적 의미 — 왜 단백질이 안쪽/바깥쪽으로 갈리나
- 코드 — Kyte-Doolittle scale로 막 단백질 검출
- 확인 퀴즈
- 챕터 정리
- Ch 2 예고
💡 마음가짐 — 외우기보다 패턴 잡기
20종 아미노산을 일일이 외우려 하지 말자. 그 4가지 카테고리와 몇 가지 특별한 케이스(Gly, Pro, Cys)만 잡으면 충분.
알파폴드 입력의 핵심이 이 20글자 시퀀스고, 그 글자들의 성질이 구조 예측의 기초가 된다 — 그래서 정확히 한 번 짚고 넘어가는 게 PART 11~13의 길을 쉽게 만든다.