시즌 1 · 알파고편 / PART 7 · PART 7 · AlphaZero (2017) / Ch 4 · 일반화의 의미

현대 AI에 미친 영향

AlphaZero 이후 AI 분야의 변화:

📖 GPT/LLM 시대 — AlphaZero 철학의 연장

2018년 이후 LLM(Large Language Model) 발달 — 핵심 원칙이 AlphaZero와 유사:

  • 단순한 알고리즘: Transformer 한 구조
  • 막대한 데이터: 인터넷 텍스트 전체
  • 도메인 지식 ↓: 일반 텍스트 학습
  • 자가 학습: self-supervised (next word 예측)

알고리즘 차이는 있지만 철학은 같음. "단순함 + 대규모 학습 = 최강".

🎯 새 AI 연구의 방향
  • End-to-End 학습: 손으로 만든 부품 제거
  • Self-supervised learning: 라벨링 없는 학습
  • Scaling laws: 큰 모델 + 큰 데이터 = 더 강함
  • 일반 알고리즘 발견: 도메인 특화 안 함

모두 AlphaZero에서 명시적으로 검증된 원칙들.

💡 AlphaZero가 시사하지 않는 것

"무한 자원이 있으면 무엇이든 학습 가능" — 이건 알파고 시리즈의 결론 아님:

  • 알파고도 정해진 도메인 (보드 게임)
  • 입력/출력 형식이 명확
  • 보상 신호가 명확 (승/패)

실제 세상은 보상 정의 어려움 (자율 주행, 로봇 등). 그래서 RL이 모든 분야에 안 통함.

그래도 보드 게임 같은 명확한 환경에서는 AlphaZero가 결정적 증명.

📖 알파고가 만든 사회적 변화
  • AI에 대한 대중 인식 변화: 이세돌 대국이 글로벌 이벤트
  • 한국에서 AI 붐: 정부 주도 AI 투자 급증 (2016 이후)
  • 바둑계 변화: 프로 기사들이 AI로 학습
  • 알파고 영화/책: 알파고 다큐멘터리 등 문화 컨텐츠