코드 — Chou-Fasman propensity로 2차 구조 예측
이 챕터의 마지막 코드. Chou-Fasman propensity를 직접 써서 짧은 서열의 2차 구조를 예측해보자.
🎯 코드가 하는 일
- P(α) 값 20개, P(β) 값 20개 정의 (Chou-Fasman 1974)
- 세 가지 알려진 단백질 영역 분석:
- Myoglobin의 α-helix A
- Immunoglobulin V domain의 β-strand
- 일반 mixed 영역
- 각 영역의 평균 P(α), P(β) 계산
- 둘을 비교해서 α-helix / β-sheet / loop 예측
이게 1974년 단백질 구조 예측의 첫 컴퓨터 알고리즘. 정확도는 약 50~60%로 한계가 있지만, 직관은 정확히 잡힌다 — "잔기의 화학적 성질이 구조 선호도를 결정한다".
PYTHON