- toc {:toc}
Introduction
LeNet-5 κ° λ§λ€μ΄μ§κΈ° μ κΉμ§ μκΈμ¨μ λν ν¨ν΄ μΈμμ λν μ°κ΅¬κ° κ³μν΄μ μ΄λ£¨μ΄μ§κ³ μμλ€. μ ν΅μ μΈ ν¨ν΄μΈμ μμ€ν
μ κ²½μ° hand-designed feature extractor, fully-connected multi-layer classifier 2 κ°μ§ λͺ¨λλ‘ μ΄λ£¨μ΄μ Έ μλ€. μ΄ μμ€ν
μ μ¬λ¬ λ¬Έμ κ° μλ€.
{: .center}
μ ν΅μ μΈ μμ€ν μ λ¬Έμ μ
1. Input κ³Ό κ΄λ ¨λ μ λ³΄λ§ μΆμΆνλ€.
hand-designed feature extractor μ κ²½μ° input μ μ μ ν μ λ³΄λ§ μ ννλ€. λΆμ μ ν μ 보λ μ κ±°νλ€. λ¨μν λ΄€μ λλ μ λ¬Έμ κ° λλκ° μΆμ§λ§ input μ μ μ ν μ λ³΄λ§ μ ννλ κ²μ κ²°κ΅ overfitting μ λ§λ€κ³ μΌλ°νλ₯Ό μ΄λ£¨μ§ λͺ»νλ€. λλ¬Έμ κ° κ²½μ°μ λ§λ λ λ§μ input λ°μ΄ν°λ₯Ό νμλ‘ νκ² λλ€.
feature extractor λ μ€κ³ν μ¬λμ΄ μΆμΆν μ λ³΄λ§ classifier λ‘ μ λ¬λκΈ° λλ¬Έμ μ νλ μ λ³΄κ° μ λ¬λλ€. κ²°κ΅ μ΄μμ μΈ νμ΅μ feature extractor μ체μμ μ΄λ£¨μ΄μ§λ κ²μ΄λΌ λ§νλ€.
2. Parameter κ° λ무 λ§λ€.
νλμ μ΄λ―Έμ§λ λͺ λ°±κ°μ pixel μ κ°μ§λ€. fully-connected multi layer μμ 첫 λ²μ§Έ layer λ§μ 보λλΌλ λͺ λ§ κ°μ κ°μ€μΉλ₯Ό ν¬ν¨νλ€. parameter κ° λ무 λ§μ κ²½μ° μμ€ν μ capacity λ₯Ό μ¦κ°μν€κΈ° λλ¬Έμ λ ν° training set μ μꡬνλ€. μΆκ°μ μΌλ‘ λ§μ parameter λ₯Ό μ²λ¦¬ν΄μΌ νλ―λ‘ λ©λͺ¨λ¦¬ ν λΉλλ λ§€μ° μ¦κ°νλ€.
μκΈμ¨λ μ¬λ¬ μ€νμΌμ΄ μκΈ° λλ¬Έμ input μ translation, distortion μ΄ μκΈ΄λ€. fully-connected layer λ μ΄λ° input μ κ΄λ ¨λ κ²°κ³Όκ°μ μμ±νλλ‘ νμ΅λλ€. 곡ν΅μ μΌλ‘ λνλλ νΉμ§μ΄λλΌλ λΉμ·ν κ°μ€μΉ ν¨ν΄λ€ κ°μ§ λ€μμ μ λμ ν΅ν΄ κ²°κ³Όκ°μ μΆλ ₯νλ€. (μ€λ³΅μ μΌλ‘ μ¬μ©νκ² λλ€) λλ¬Έμ λͺ¨λ κ°μ€μΉ ν¨ν΄μ νμ΅νλ κ²μ λ§μ νμ΅ instance λ₯Ό νμλ‘ νλ€.
3. Input μ topology κ° μμ ν 무μλλ€.
μ΄λ―Έμ§λ₯Ό fully-connected layer λ₯Ό ν΅ν΄ λμ΄ν΄ μ¬μ©νκΈ° λλ¬Έμ 2D input μ μμΉ μ 보λ₯Ό μ΄μ©νμ§ λͺ»νλ€.
LeNet-5
Convolution Network
Convolution Network λ 3 κ°μ μμ΄λμ΄λ‘ κ²°ν©λμ΄ μλ€.
(local receptive fields, shared weights, sub-sampling)
1. Local receptive fields
CNN μ receptive field λ₯Ό local λ‘ μ ννμ¬ edge, end-point, corner μ κ°μ local feature λ₯Ό μΆμΆνλ€. μΆμΆλ feature λ€μ λ€μ layer μ μ λ ₯μ΄ λμ΄ κ³ μ°¨μμ νΉμ§μ μΆμΆνλ€.
μ΄λ₯Ό ν΅ν΄ input μ΄ distortion μ΄λ shift κ°μ΄λ°μνλλΌλ λΉμ·ν νΉμ§μ κ°λ λ°°μ΄μ΄ receptive field μ μΆμΆλλ©΄ ν΄λΉ νΉμ§μ λ°μν feature map μ λ§λ€ μ μλ€.
ν΄λΉ local μ λν κ³μ°μ μ§ννκΈ° λλ¬Έμ parameter μ μλ μ€μΌ μ μλ€.
2. Shared weight
CNN μ λμΌν weight μ bias λ₯Ό 곡μ νμ¬ μ¬μ©νλ€. μ΄λ₯Ό μ΄μ©νμ¬ shift μ λν λΆλ³μ±μ μ»λλ€.
β CNN μ input μ μ²μλΆν° λκΉμ§ μ΄λνλ©° feature map μ λ§λ λ€. μ΄ λ κ°μ€μΉλ μ΄λν λ λμΌν weight μ bias λ₯Ό μ¬μ©νκΈ° λλ¬Έμ μμΉκ° λ°λλλΌλ λμΌν νΉμ§μ μΆμΆνλ€.
μ΄λ κ² shared weight λ₯Ό ν΅ν΄μ κ³μ° capacity λ₯Ό μ€μΌ μ μκ³ νμ΅ν parameter μ μλ μ€μ¬μ€λ€.
λ€λ₯Έ λ Όλ¬Έμμ μ¦λͺ λ μ΄λ‘ μ λ°λ₯΄λ©΄
E_{train}
k
h
\alpha
P