시즌 1에서 시즌 2로 이어지는 것과 끊어지는 것
구체적으로 알파고와 알파폴드 사이에 무엇이 같고 무엇이 다른지 미리 정리해두자. PART 10 이후에 자주 참고하게 될 정보다.
🎯 이어지는 것 — 같은 사고방식
- 학습 우선 (learning over hand-coding): 도메인 지식을 코드에 박지 않고 학습으로 처리
- End-to-end 학습: 입력에서 출력까지 한 시스템으로 학습
- 대규모 데이터 + 계산: 작은 모델 + 적은 데이터의 시대와 결별
- 구조의 분해: 큰 신경망을 여러 모듈로 나눠 각자 역할 (h, g, f 같은 분해)
- 잠재 표현 위에서의 작업: 원시 입력을 잠재 공간으로 옮긴 뒤 처리
- 반복적 개선: AlphaFold 2의 Recycling은 MCTS의 시뮬레이션 반복과 정신적 형제
🎯 끊어지는 것 — 알고리즘 자체는 다름
- 강화학습 → 지도학습: 알파고는 RL, 알파폴드는 지도학습 (이미 정답 구조가 PDB에 있음)
- MCTS → Transformer/Attention: 트리 탐색이 없다. 한 번의 forward pass로 답
- 이산 행동 → 연속 출력: "어디에 둘까"가 아니라 "원자 좌표가 어디인가"
- 승/패 보상 → 거리 손실: Elo 같은 게 아니라 RMSD/GDT-TS
- self-play → MSA: 데이터 생성 방식 자체가 완전히 다름. 자가 대국 대신 진화 정렬
💡 정리 — 사고방식은 같고 도구는 다르다
알파고와 알파폴드의 관계는 "같은 가족, 다른 직업" 같은 느낌이다.
- 철학(사람 지식 줄이고 학습) 같음
- 큰 그림(end-to-end, 모듈 분해, 대규모) 같음
- 도메인이 다르다 보니 알고리즘 자체는 완전히 다름
그래서 시즌 1을 배운 게 시즌 2에 직접적인 코드 차원의 도움은 적지만, "이런 식으로 문제에 접근하는구나"의 감각은 큰 도움이 된다.