시즌 1 · 알파고편 / PART 5 · PART 5 · AlphaGo (2016) / Ch 6 · 7x7 미니 알파고 구현

시즌 1 완결 — 그리고 시즌 2 예고

🏆 시즌 1 알파고편 — 30 챕터 완성

PART 1부터 PART 5까지의 여정:

  • 바둑 우주 → 탐색의 한계 → 무작위의 힘 → 신경망 → 알파고 통합
  • 5x5 → 7x7 → 19x19 (개념적)
  • 코드 ~500줄로 알파고 본질 구현
📊 진행률 (시즌 1 75% 완료)
  • PART 1: 7 챕터 52 섹션 ✅
  • PART 2: 6 챕터 40 섹션 ✅
  • PART 3: 5 챕터 32 섹션 ✅
  • PART 4: 6 챕터 37 섹션 ✅
  • PART 5: 6 챕터 33 섹션 ✅ (이번)
  • PART 6 (AlphaGo Zero): 5 챕터 ⬜
  • PART 7 (AlphaZero): 4 챕터 ⬜

30/39 챕터 = 시즌1의 77%. 9 챕터 남음.

➡️ PART 6 — AlphaGo Zero (2017)

1년 후 DeepMind의 새 발표: "사람 데이터 없이도 더 강하다."

AlphaGo Zero의 차이:

  • SL Policy 단계 제거 — 사람 게임 데이터 사용 안 함
  • Policy + Value를 하나의 신경망으로 통합 (이중 출력)
  • Rollout 제거 — Value만 사용
  • 40일 학습으로 알파고 (2016)를 100-0 격파
  • 더 단순한 알고리즘 → 더 강함 (Occam's Razor 사례)

PART 6는 "백지에서 시작" 철학. 그리고 PART 7은 그 알고리즘을 체스/쇼기/바둑 모두에 적용한 AlphaZero.

🎯 시즌 2 — 알파폴드 편 (먼 미래)

모든 알파고 시리즈가 끝나면 — 시즌 2: 알파폴드.

  • 같은 DeepMind 팀
  • 2018-2020년 단백질 구조 예측 혁명
  • 알파고와 다른 알고리즘 — Attention + Evoformer
  • 생명과학에 미친 충격

지금은 시즌 1에 집중. PART 6, 7로 알파고 시리즈 완결.

🙏 시즌 1 알파고편 완결 — 감사

여기까지 따라온 분께 박수. 우리는:

  • 알파고가 무엇이고 어떻게 만들어졌는지 이해
  • 핵심 부품을 직접 코드로 구현
  • 역사적 사건 (이세돌 4국)을 알고리즘 관점에서 분석

알파고는 더 이상 미스터리가 아님. 우리가 이해할 수 있는 시스템.