๐Ÿ“Œ ์‹ ๊ฒฝ๋ง์˜ ํ›ˆ๋ จ๊ณผ์ •์ธ ์˜ค์ฐจ์—ญ์ „ํŒŒ์— ๋Œ€ํ•ด ์•Œ์•„๋ณด์ž. {: .note}

Back-propagation(์˜ค์ฐจ ์—ญ์ „ํŒŒ)

Neural Net์„ ํ†ตํ•œ ์‹ฌ์ธต์‹ ๊ฒฝ๋ง์„ ๊ตฌ์„ฑํ•œ ๊ฒฝ์šฐ Input๊ฐ’์€ ์‹ ๊ฒฝ๋ง์„ ๊ฑฐ์ณ Output์œผ๋กœ ์‚ฐ์ถœ๋œ๋‹ค.

Forwardpropagation

  • Forwardpass : Input โ†’ Net โ†’ Output ์˜ ๊ณผ์ •
  • Forward-Propagation : ์†์‹ค๊ฐ’์„ ๊ตฌํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” Fowardpass๋ฅผ ๊ฑฐ์ณ ์˜ˆ์ธก๊ฐ’๊ณผ ์‹ค์ œ๊ฐ’์˜ ๋น„๊ต๋ฅผ ํ†ตํ•ด์„œ ์†์‹ค๊ฐ’์„ ๊ตฌํ•  ์ˆ˜ ์žˆ์—ˆ๋‹ค. ์ด์ฒ˜๋Ÿผ ์ˆœ์ฐจ์ ์œผ๋กœ ๊ณ„์‚ฐํ•ด ์†์‹ค๊ฐ’์„ ๊ตฌํ•˜๊ณ  Neural Network์˜ ๊ฐ€์ค‘์น˜๋ฅผ ํ•™์Šตํ•˜๋Š” ๊ณผ์ •์„ ๋งํ•œ๋‹ค.
  • Fowardpropagation์˜ ๊ฒฝ์šฐ ๊ฐ Layer์˜ ๋‰ด๋Ÿฐ๋“ค๊ณผ ์ „๋ถ€ ์—ฐ๊ฒฐ๋˜์–ด์•ผ ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ๊ณ„์‚ฐ๋Ÿ‰์ด ๋งŽ๋‹ค.

Forwardpropagation{: width=โ€œ600โ€}{: .center}

์œ„์™€ ๊ฐ™์ด ์—ฐ์‡„ ๋ฒ•์น™์„ ์‚ฌ์šฉํ•˜์—ฌ ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ๋‹ค.

  • Output์„ ๊ฒฐ์ •ํ•˜๊ธฐ ์œ„ํ•ด 15๋ฒˆ์˜ ๊ณ„์‚ฐ์„ ํ•ด์•ผ ํ•œ๋‹ค.
  • ์ด๋ฏธ์ง€๋ฅผ ๊ณ„์‚ฐํ•œ๋‹ค๊ณ  ๊ฐ€์ •ํ•˜๋ฉด ๋Š” ๊ฐ ํ”ฝ์…€๋“ค์ด ๋˜์–ด Output์„ ๊ตฌํ•œ๋‹ค. ํ•œ ๊ฐœ์˜ ์ด๋ฏธ์ง€๋ฅผ ์ฒ˜๋ฆฌํ•œ๋‹ค๊ณ  ํ•˜๋”๋ผ๋„ ํ›ˆ๋ จ๋ฐ์ดํ„ฐ์˜ ํฌ๊ธฐ, ์€๋‹‰์ธต์˜ ๊นŠ์ด๊ฐ€ ๊นŠ์–ด์งˆ์ˆ˜๋ก ๊ณ„์‚ฐ๋Ÿ‰์ด ๊ธฐํ•˜๊ธ‰์ˆ˜์ ์œผ๋กœ ์ฆ๊ฐ€ํ•œ๋‹ค.

โ‡’ ์ด๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด Back-propagation์„ ๊ณ ์•ˆํ–ˆ๋‹ค.

Backpropagation

  • Backwardpass : Forwardpass์™€์˜ ๋ฐ˜๋Œ€๋ฐฉํ–ฅ์œผ๋กœ ์ด๋™ํ•˜๋Š” ๊ณผ์ • Output โ†’ Net โ†’ Input
  • Backpropagation : Output Layer๋ถ€ํ„ฐ ์—ญ์ˆœ์œผ๋กœ Gradient๋ฅผ ์ „๋‹ฌํ•˜์—ฌ ์ „์ฒด Layer์˜ ๊ฐ€์ค‘์น˜๋ฅผ ์—…๋ฐ์ดํŠธํ•˜๋Š” ๋ฐฉ์‹
  • ์—ฐ์‡„๋ฒ•์น™(Chain Rule)์„ ์‚ฌ์šฉํ•œ ์—ฐ์‚ฐ์„ ํ†ตํ•ด ๊ณ„์‚ฐ๋Ÿ‰์„ ํ˜„์ €ํ•˜๊ฒŒ ์ค„์ผ ์ˆ˜ ์žˆ๋‹ค.

์œ„ ๊ทธ๋ฆผ์˜ ํ•ฉ์„ฑํ•จ์ˆ˜๋ฅผ gradient๋ฅผ ๊ตฌํ•˜๊ธฐ ์œ„ํ•ด ํŽธ๋ฏธ๋ถ„์„ ํ†ตํ•ด ํ‘œํ˜„ํ•˜๋ฉด ์•„๋ž˜์™€ ๊ฐ™์ด ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ๋‹ค.

  • ์•„๋ž˜ ๊ทธ๋ฆผ์˜ Backwardpass์™€ ๊ฐ™์ด Output์—์„œ ์‚ฌ์šฉํ•œ ์—ฐ์‚ฐ์„ x, y๋ฅผ ๊ตฌํ•  ๋•Œ ์—ฐ์‡„๋ฒ•์น™์„ ํ†ตํ•ด ์‚ฌ์šฉํ•จ์œผ๋กœ์จ ๊ฐ„๋‹จํ•˜๊ฒŒ gradient๋ฅผ ๊ตฌํ•  ์ˆ˜ ์žˆ๋‹ค.

gradient{: .center}

Backpropagation{: .center} ์ถœ์ฒ˜: CS231n Lecture4 Backpropagation

๊ฒฐ๊ตญ Input์ด Layer 1๊ฐœ์— ๋“ค์–ด๊ฐ€ ๊ณ„์‚ฐ์„ ์ง„ํ–‰ํ•  ๋•Œ gradient ๊ณ„์‚ฐ์„ ํ•ด๋‘”๋‹ค๋ฉด Backpropagation์œผ๋กœ ๊ฑฐ์Šฌ๋Ÿฌ ์˜ฌ๋ผ๊ฐˆ ๋•Œ ์ด์ „ gradient์™€์˜ ์—ฐ์‡„๋ฒ•์น™์„ ํ†ตํ•ด ์›ํ•˜๋Š” gradient๋ฅผ ์‰ฝ๊ฒŒ ๊ตฌํ•  ์ˆ˜ ์žˆ๋‹ค.