์์ฐจ ๋ฐ์ดํฐ๋ฅผ ์ด๋ป๊ฒ ์ํ ์ ๊ฒฝ๋ง์ ํตํด ์ฒ๋ฆฌํ๋์ง ์์๋ณด์.
๊ธฐ์ต ์์คํ
- ๋ง์ฝ ์๋ฆฌ ๊ฐ์ ๊ฐ์ธ ๋น์์ ๊ฒฝ์ฐ ์ฌ๋ฐ๋ฅธ ๋๋ต์ ํ๋ ค๋ฉด ์ ๋ ฅ์ ๋ฐ์ ๋๋ง๋ค ๊ทธ ๋ด์ฉ์ ๊ธฐ์ตํด์ผ ํ๋ค.
- ๋ฐ๋๋ก ์ด์ ์
๋ ฅ์ ๊ธฐ์ตํ์ง ์๋ ์์คํ
์ ๋ฌด๊ธฐ์ต ์์คํ
์ด๋ผ ํ๋ค.
- ์์ ์ ๊ฒฝ๋ง(Shallow Neural Network)์ด ๋ฌด๊ธฐ์ต ์์คํ ์ ์์
- n๋ฒ์งธ Time-Step์ ๋ํ ๊ฒฐ๊ณผ๊ฐ ์ด์ ์ ๋ ฅ์ ์ํฅ ๋ฐ์ง ์๋๋ค.
๊ธฐ๋ณธ์ ์ธ ์ํ ์ ๊ฒฝ๋ง (Vanilla Recurrent Network)
- Vanilla RNN์ ๊ตฌ์กฐ๋ shallow NN ๊ตฌ์กฐ์ '์ํ(recurrent)'์ด ์ถ๊ฐ๋ ๊ฒ์ด๋ค.
- ์ํ: n-1๋ฒ์งธ time step์ด n๋ฒ์งธ time step์ผ๋ก ๋ค์ ๋์์ค๋ ๊ฒ
- ๊ธฐ์ต ์์คํ ์ด๋ฏ๋ก RNN์ ์ถ๋ ฅ์ ์ด์ ์ ๋ชจ๋ ์ ๋ ฅ์ ์ํฅ์ ๋ฐ๋๋ค.
๋ค์ธต ๊ณ์ธต ์ํ ์ ๊ฒฝ๋ง (Multi-Layer RNN)
- ์ํ ์ ๊ฒฝ๋ง๋ ์ฌ์ธต ์ ๊ฒฝ๋ง์ฒ๋ผ ๊น๊ฒ ์ฌ๋ฆด ์ ์๋ค.
- ํ์ง๋ง, ์ ๊ฒฝ๋ง์ ๊ตฌ์กฐ๊ฐ ๋งค์ฐ ๋ณต์กํด์ง๊ณ depth๊ฐ ๊น์ด์ง์๋ก time step์ด ๋์ด๊ฐ gradient๊ฐ ๋ซ๊ณ ๋์ํ ํด ๋ณต์กํ๋ค.
- ๋ฐ๋ผ์ ๋ค์ธต ๊ณ์ธต์ด ์๋ ๋ค๋ฅธ ์ํ ์ ๊ฒฝ๋ง๋ค์ด ์ฃผ๋ก ์ฌ์ฉ๋๋ค.
์ฌํ ์ํ ์ ๊ฒฝ๋ง
- LSTM, GRU ๋ฑ์ ๋ํด ์์๋ณด์.
LSTM(Long Short-Term Memory)
- ๊ธฐ์ตํ ๊ฒ์ ์ค๋ ๊ธฐ์ตํ๊ณ ์์ ๊ฒ์ ๋นจ๋ฆฌ ์์ด๋ฒ๋ฆฌ๋ ๋ฅ๋ ฅ ์์
- Cell State
- ๊ธฐ์ต์ ์ค๋ ์ ์งํ ์ ์๊ฒ ์๋ก์ด ํน์ง์ ๋ง์ ์ผ๋ก ๋ฐ๋ ๊ตฌ์กฐ (Residual Network์ ๋น์ท)
- Hidden State
- ๊ณ์ธต์ ์ถ๋ ฅ (๋ค์ ํ์ ์คํ ์ผ๋ก ๋๊ธฐ๋ ์ ๋ณด)
- Forget Gate
- sigmoid ํ์ฑ ํจ์๋ก 0-1 ์ถ๋ ฅ๊ฐ ๊ฐ์ง
- cell state์ forget gate๋ฅผ ๊ณฑํด์ฃผ์ด ์ผ๋งํผ ์์์ง ๊ฒฐ์
- Input Gate
- sigmoid ํ์ฑ ํจ์๋ก 0-1 ์ถ๋ ฅ๊ฐ ๊ฐ์ง
- ์๋กญ๊ฒ ์ถ์ถํ ํน์ง์ ์ผ๋งํผ ์ฌ์ฉํ ์ง ๊ฒฐ์
- Output Gate
- sigmoid ํ์ฑ ํจ์๋ก 0-1 ์ถ๋ ฅ๊ฐ ๊ฐ์ง
- Cell๋ก๋ถํฐ ์ถ๋ ฅ์ ์ผ๋ง๋ ๋ด๋ณด๋ผ์ง ๊ฒฐ์ ํ๋ ์ญํ
GRU(Gated Recurrent Unit)
- LSTM์ ๊ฐ์ํํ ๋ฒ์
- Cell state๊ฐ ์๊ณ Hidden State๋ง ์กด์ฌ
- Forget Gate์ Input Gate ๊ฒฐํฉ
- Forget Gate๋ฅผ 1์์ ๋นผ์ input Gate๋ก ์ฌ์ฉ
- Reset Gate ์ถ๊ฐ
- Sigmoid ํ์ฑ ํจ์๋ก 0-1 ์ถ๋ ฅ๊ฐ ๊ฐ์ง
- ์ด์ hidden state๋ฅผ ์ผ๋ง๋ ์ฌ์ฉํ ์ง ์ ํ๋ ์ญํ
- 0์ ๊ฐ๊น์ด ๊ฐ ๋๋ฉด 'Reset'
- ์ ๋ฐ์ ์ผ๋ก ๊ธฐ์ต์ ์ด๋ป๊ฒ ๋๊ณ ๊ฐ๋์ง๋ forget gate์ง๋ง ํ์ฌ ์ feature ๋ฝ์ ๋ ์ด์ ๊ธฐ์ต์ ์ผ๋งํผ ์ํฅ๋ฐ๊ฒ ํ ์ง๋ reset gate
728x90