시즌 1 · 알파고편 / PART 5 · PART 5 · AlphaGo (2016) / Ch 6 · 7x7 미니 알파고 구현

7x7 미니 알파고 — 우리가 알파고를 만든다

🏆 시즌 1 클라이맥스

드디어 알파고를 만든다. 7x7 보드에 맞는 미니 알파고. 지금까지 만든 모든 부품 통합.

최종 코드 구조:

📖 미니 알파고의 부품
  1. Board 클래스 (PART 1) — 7x7 게임 규칙
  2. Policy Network (PART 4 Ch 5) — 학습된 정책
  3. Value Network (PART 4 Ch 4) — 학습된 가치
  4. MCTS with PUCT (PART 3 + PART 5 Ch 4) — 트리 탐색
  5. 통합 함수: alphago_move(board) → 다음 수
🎯 알파고와의 차이 — 축소판
속성 알파고 우리 미니 알파고
보드19x197x7
입력 채널483 (흑/백/빈)
CNN 깊이13층3층
필터 수19216
가중치 수350만3,000 정도
MCTS iter50,000500
학습 데이터3000만합성 1000개 (시범)

스케일은 다르지만 알고리즘은 동일.

이 챕터의 코드는 길어 (이 책의 가장 큰 코드 섹션). 그래도 본질은 우리가 PART 1~4에서 만든 것들의 결합.