시즌 1 · 알파고편 / PART 4 · PART 4 · 신경망 등장: 직관을 학습한다 / Ch 1 · 퍼셉트론에서 MLP까지

퍼셉트론의 해부

퍼셉트론은 4개 부품으로 구성:

📖 퍼셉트론의 4 부품
  1. 입력 x₁, x₂, ..., xₙ — 숫자들. 예: 키, 몸무게, 나이.
  2. 가중치 w₁, w₂, ..., wₙ — 각 입력의 중요도. 학습으로 정해짐.
  3. 편향 b (bias) — 출발선 보정. 학습으로 정해짐.
  4. 활성화 함수 f — 출력 모양을 정함. step, sigmoid, ReLU 등.

수식:

y = f(w₁·x₁ + w₂·x₂ + ... + wₙ·xₙ + b)

벡터 표기로 더 간단:

y = f(w · x + b)
🎯 직관적 예시 — 이메일 스팸 분류

입력: x = [메일에 "광고"가 들어간 횟수, 발신자 평판, 첨부 파일 크기 MB]

학습으로 가중치 = [+2.0, -3.0, +0.5] 가 찾아진다고 하자:

  • "광고"가 많으면 → 가중치 +2.0 → 스팸 점수 ↑
  • 발신자 평판이 좋으면 → 가중치 -3.0 → 스팸 점수 ↓
  • 첨부 파일이 크면 → 가중치 +0.5 → 스팸 점수 약간 ↑

합계 + 편향 → 활성화 함수 통과 → 스팸 / 정상 분류.

💡 활성화 함수가 왜 필요한가

w·x + b는 선형 함수. 선형만 쌓으면 여전히 선형이라 복잡한 패턴을 못 잡음.

비선형 활성화 함수(sigmoid, ReLU)가 비선형성을 더해줌. 이게 신경망이 복잡한 패턴을 학습하는 비결.

가장 단순한 활성화 함수 3가지:

  • Step (계단): x ≥ 0이면 1, 아니면 0. 1957 원본 퍼셉트론.
  • Sigmoid: 1/(1 + e^(-x)). 0~1 사이 부드러운 곡선. 확률 출력에 좋음.
  • ReLU: max(0, x). 음수면 0, 양수면 그대로. 알파고도 사용.

이제 코드로!