시즌 1에서 시즌 2로 이어지는 것과 끊어지는 것

구체적으로 알파고와 알파폴드 사이에 무엇이 같고 무엇이 다른지 미리 정리해두자. PART 10 이후에 자주 참고하게 될 정보다.

🎯 이어지는 것 — 같은 사고방식

학습 우선 (learning over hand-coding): 도메인 지식을 코드에 박지 않고 학습으로 처리
End-to-end 학습: 입력에서 출력까지 한 시스템으로 학습
대규모 데이터 + 계산: 작은 모델 + 적은 데이터의 시대와 결별
구조의 분해: 큰 신경망을 여러 모듈로 나눠 각자 역할 (h, g, f 같은 분해)
잠재 표현 위에서의 작업: 원시 입력을 잠재 공간으로 옮긴 뒤 처리
반복적 개선: AlphaFold 2의 Recycling은 MCTS의 시뮬레이션 반복과 정신적 형제

🎯 끊어지는 것 — 알고리즘 자체는 다름

강화학습 → 지도학습: 알파고는 RL, 알파폴드는 지도학습 (이미 정답 구조가 PDB에 있음)
MCTS → Transformer/Attention: 트리 탐색이 없다. 한 번의 forward pass로 답
이산 행동 → 연속 출력: "어디에 둘까"가 아니라 "원자 좌표가 어디인가"
승/패 보상 → 거리 손실: Elo 같은 게 아니라 RMSD/GDT-TS
self-play → MSA: 데이터 생성 방식 자체가 완전히 다름. 자가 대국 대신 진화 정렬

💡 정리 — 사고방식은 같고 도구는 다르다

알파고와 알파폴드의 관계는 "같은 가족, 다른 직업" 같은 느낌이다.

철학(사람 지식 줄이고 학습) 같음
큰 그림(end-to-end, 모듈 분해, 대규모) 같음
도메인이 다르다 보니 알고리즘 자체는 완전히 다름

그래서 시즌 1을 배운 게 시즌 2에 직접적인 코드 차원의 도움은 적지만, "이런 식으로 문제에 접근하는구나"의 감각은 큰 도움이 된다.

← 이전 DeepMind의 실제 전환 — 알파고 직후의 결정 다음 → 시즌 2의 남은 길 — PART 10~14 미리보기