시즌 1 완결 — 그리고 시즌 2 예고
🏆 시즌 1 알파고편 — 30 챕터 완성
PART 1부터 PART 5까지의 여정:
- 바둑 우주 → 탐색의 한계 → 무작위의 힘 → 신경망 → 알파고 통합
- 5x5 → 7x7 → 19x19 (개념적)
- 코드 ~500줄로 알파고 본질 구현
📊 진행률 (시즌 1 75% 완료)
- PART 1: 7 챕터 52 섹션 ✅
- PART 2: 6 챕터 40 섹션 ✅
- PART 3: 5 챕터 32 섹션 ✅
- PART 4: 6 챕터 37 섹션 ✅
- PART 5: 6 챕터 33 섹션 ✅ (이번)
- PART 6 (AlphaGo Zero): 5 챕터 ⬜
- PART 7 (AlphaZero): 4 챕터 ⬜
30/39 챕터 = 시즌1의 77%. 9 챕터 남음.
➡️ PART 6 — AlphaGo Zero (2017)
1년 후 DeepMind의 새 발표: "사람 데이터 없이도 더 강하다."
AlphaGo Zero의 차이:
- SL Policy 단계 제거 — 사람 게임 데이터 사용 안 함
- Policy + Value를 하나의 신경망으로 통합 (이중 출력)
- Rollout 제거 — Value만 사용
- 40일 학습으로 알파고 (2016)를 100-0 격파
- 더 단순한 알고리즘 → 더 강함 (Occam's Razor 사례)
PART 6는 "백지에서 시작" 철학. 그리고 PART 7은 그 알고리즘을 체스/쇼기/바둑 모두에 적용한 AlphaZero.
🎯 시즌 2 — 알파폴드 편 (먼 미래)
모든 알파고 시리즈가 끝나면 — 시즌 2: 알파폴드.
- 같은 DeepMind 팀
- 2018-2020년 단백질 구조 예측 혁명
- 알파고와 다른 알고리즘 — Attention + Evoformer
- 생명과학에 미친 충격
지금은 시즌 1에 집중. PART 6, 7로 알파고 시리즈 완결.
🙏 시즌 1 알파고편 완결 — 감사
여기까지 따라온 분께 박수. 우리는:
- 알파고가 무엇이고 어떻게 만들어졌는지 이해
- 핵심 부품을 직접 코드로 구현
- 역사적 사건 (이세돌 4국)을 알고리즘 관점에서 분석
알파고는 더 이상 미스터리가 아님. 우리가 이해할 수 있는 시스템.