시즌 1 · 알파고편 / PART 7 · PART 7 · AlphaZero (2017) / Ch 3 · 틱택토/커넥트포 학습

챕터 3 정리

📌 챕터 3에서 본 것

  • 틱택토를 알파고 인터페이스로 — 5개 메서드만 구현
  • 3채널 입력 형식이 게임 종속 없음 — 알파고와 동일
  • 커넥트포도 같은 패턴 — 7 열만 가능한 수
  • 신경망은 같음, 출력 크기만 조정
  • 오델로, 구오 등 다양한 게임에 적용 가능
🏆 일반화 증명

"같은 코드 + 다른 Game 인스턴스" = 다양한 게임 정복. 이게 AlphaZero의 위대한 점.

틱택토부터 19x19 바둑까지 — 동일 알고리즘이 모두 학습. 게임의 복잡도만 학습 시간 결정.

➡️ 다음 챕터에서는 — 시즌 1 마지막 챕터!

일반화의 의미. AlphaZero가 보여준 것의 깊은 의미. AI 분야에 미친 영향. 그리고 시즌 1 알파고편 완결.