- toc {:toc}
Optimizer ๋ฅผ ๊ณต๋ถํ๋ฉด์ Local Minima ์ ๋น ์ง๊ฑฐ๋ Saddle Point ์ ๋น ์ ธ๋ฒ๋ฆฌ๋ ๋ฌธ์ ๋ฅผ ๋ง์ฃผํ๋ค. ์ด ๋ฌธ์ ์ ๋ํด ํ์ ํด๋ณด์.
Global, Local Minima ๋?
-
Global Minima : ์ต์๊ฐ
-
Local Minima : ๊ทน์๊ฐ
-
์ต์๊ฐ: ์ ์์ญ ๋ด์์ ๊ฐ์ฅ ์์ ๊ฐ
-
๊ทน์๊ฐ: ์ฃผ์์ ๋ชจ๋ ์ ์ ํจ์ซ๊ฐ ์ดํ์ ํจ์ซ๊ฐ
-
์ผ๋ฐ์ ์ผ๋ก ๋ชจ๋ธ์ ํ๋ จ์ํค๋ฉด์ Loss Function ์ ์ต์ํํ๊ธฐ ์ํด ๋ ธ๋ ฅํ๊ณ ๊ฐ์ฅ ํ๊ฒ๊ฐ๊ณผ ์ ์ฌํ๋๋ก Loss ๊ฐ์ ์ต์๊ฐ์ ์ฐพ๋ ๊ฒ์ด ๋ชฉ์ ์ด๋ค.
๋๋ฌธ์ ์ต์๊ฐ์ ๊ตฌํ๊ธฐ ์ํด Gradient Descent ๋ฅผ ํตํด์ ๊ฐ์ค์น๋ฅผ ํ์ตํ๋ค๋ณด๋ฉด ๊ทน์๊ฐ์ ๋๋ฌํ๊ฒ ๋๋ค. ์ด ๋, Gradient Descent ์ ๊ฐ์ ๊ฒฝ์ฐ ์ฒซ ๋ฒ์งธ ๊ทน์๊ฐ์์ ๋ฉ์ถ๊ฒ ๋๋ฏ๋ก Local Minima ์ ๋น ์ ธ๋ฒ๋ฆฌ๋ ๋ฌธ์ ๊ฐ ๋ฐ์ํ๋ค.
-
๋๋ฌธ์ ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด์ Momentum ๊ณผ ๊ฐ์ด ๊ด์ฑ์ ์ฃผ๋ฉฐ Local Minima ๋ฅผ ๋น ์ ธ๋๊ฐ ์ ์๋ ์ฌ์ง๋ฅผ ์ฃผ๋ ๊ฒ์ด๋ค.
{: width=โ600โ}{: .center}
Saddle Point ๋?
- Saddle Point(์์ฅ์ ) : ๋ค๋ณ์ ์คํจ์์ ๋ฒ์ญ์์, ์ด๋ ๋ฐฉํฅ์์ ๋ณด๋ฉด ๊ทน๋๊ฐ์ด์ง๋ง ๋ค๋ฅธ ๋ฐฉํฅ์์ ๋ณด๋ฉด ๊ทน์๊ฐ์ด ๋๋ ์ ์ด๋ค.
- ์๋ ๊ทธ๋ฆผ์ ๋นจ๊ฐ์ ์ผ๋ก ํ์๋ ๋ถ๋ถ์ ๋งํ๋ค.
- ์์ฅ์ ๊ฐ์ ๊ฒฝ์ฐ๋ gradient ๊ฐ 0 ์ด ๋๊ธฐ ๋๋ฌธ์ ํ์ต๊ฒฐ๊ณผ๊ฐ ์์ฅ์ ์์ ์๋ ดํ ์ ์๋ค๋ ์ ์ด ๋ฌธ์ ๊ฐ ๋๋ค.
{: width=โ600โ}{: .center}