시즌 1 완결 — 그리고 시즌 2 예고

🏆 시즌 1 알파고편 — 30 챕터 완성

PART 1부터 PART 5까지의 여정:

바둑 우주 → 탐색의 한계 → 무작위의 힘 → 신경망 → 알파고 통합
5x5 → 7x7 → 19x19 (개념적)
코드 ~500줄로 알파고 본질 구현

📊 진행률 (시즌 1 75% 완료)

PART 1: 7 챕터 52 섹션 ✅
PART 2: 6 챕터 40 섹션 ✅
PART 3: 5 챕터 32 섹션 ✅
PART 4: 6 챕터 37 섹션 ✅
PART 5: 6 챕터 33 섹션 ✅ (이번)
PART 6 (AlphaGo Zero): 5 챕터 ⬜
PART 7 (AlphaZero): 4 챕터 ⬜

30/39 챕터 = 시즌1의 77%. 9 챕터 남음.

➡️ PART 6 — AlphaGo Zero (2017)

1년 후 DeepMind의 새 발표: "사람 데이터 없이도 더 강하다."

AlphaGo Zero의 차이:

SL Policy 단계 제거 — 사람 게임 데이터 사용 안 함
Policy + Value를 하나의 신경망으로 통합 (이중 출력)
Rollout 제거 — Value만 사용
40일 학습으로 알파고 (2016)를 100-0 격파
더 단순한 알고리즘 → 더 강함 (Occam's Razor 사례)

PART 6는 "백지에서 시작" 철학. 그리고 PART 7은 그 알고리즘을 체스/쇼기/바둑 모두에 적용한 AlphaZero.

🎯 시즌 2 — 알파폴드 편 (먼 미래)

모든 알파고 시리즈가 끝나면 — 시즌 2: 알파폴드.

같은 DeepMind 팀
2018-2020년 단백질 구조 예측 혁명
알파고와 다른 알고리즘 — Attention + Evoformer
생명과학에 미친 충격

지금은 시즌 1에 집중. PART 6, 7로 알파고 시리즈 완결.

🙏 시즌 1 알파고편 완결 — 감사

여기까지 따라온 분께 박수. 우리는:

알파고가 무엇이고 어떻게 만들어졌는지 이해
핵심 부품을 직접 코드로 구현
역사적 사건 (이세돌 4국)을 알고리즘 관점에서 분석

알파고는 더 이상 미스터리가 아님. 우리가 이해할 수 있는 시스템.

← 이전 시즌 1 회고 — 우리가 만든 것 다음 → PART 6 — AlphaGo Zero (2017)