728x90

rnn 2

[RNN] 2. Vanialla RNN, LSTM(Long Short-Term Memory), GRU(Gated Recurrent Unit)

์ˆœ์ฐจ ๋ฐ์ดํ„ฐ๋ฅผ ์–ด๋–ป๊ฒŒ ์ˆœํ™˜ ์‹ ๊ฒฝ๋ง์„ ํ†ตํ•ด ์ฒ˜๋ฆฌํ•˜๋Š”์ง€ ์•Œ์•„๋ณด์ž. ๊ธฐ์–ต ์‹œ์Šคํ…œ ๋งŒ์•ฝ ์‹œ๋ฆฌ ๊ฐ™์€ ๊ฐœ์ธ ๋น„์„œ์˜ ๊ฒฝ์šฐ ์˜ฌ๋ฐ”๋ฅธ ๋Œ€๋‹ต์„ ํ•˜๋ ค๋ฉด ์ž…๋ ฅ์„ ๋ฐ›์„ ๋•Œ๋งˆ๋‹ค ๊ทธ ๋‚ด์šฉ์„ ๊ธฐ์–ตํ•ด์•ผ ํ•œ๋‹ค. ๋ฐ˜๋Œ€๋กœ ์ด์ „ ์ž…๋ ฅ์„ ๊ธฐ์–ตํ•˜์ง€ ์•Š๋Š” ์‹œ์Šคํ…œ์€ ๋ฌด๊ธฐ์–ต ์‹œ์Šคํ…œ์ด๋ผ ํ•œ๋‹ค. ์–•์€ ์‹ ๊ฒฝ๋ง(Shallow Neural Network)์ด ๋ฌด๊ธฐ์–ต ์‹œ์Šคํ…œ์˜ ์˜ˆ์‹œ n๋ฒˆ์งธ Time-Step์— ๋Œ€ํ•œ ๊ฒฐ๊ณผ๊ฐ€ ์ด์ „ ์ž…๋ ฅ์— ์˜ํ–ฅ ๋ฐ›์ง€ ์•Š๋Š”๋‹ค. ๊ธฐ๋ณธ์ ์ธ ์ˆœํ™˜ ์‹ ๊ฒฝ๋ง (Vanilla Recurrent Network) Vanilla RNN์˜ ๊ตฌ์กฐ๋Š” shallow NN ๊ตฌ์กฐ์— '์ˆœํ™˜(recurrent)'์ด ์ถ”๊ฐ€๋œ ๊ฒƒ์ด๋‹ค. ์ˆœํ™˜: n-1๋ฒˆ์งธ time step์ด n๋ฒˆ์งธ time step์œผ๋กœ ๋‹ค์‹œ ๋Œ์•„์˜ค๋Š” ๊ฒƒ ๊ธฐ์–ต ์‹œ์Šคํ…œ์ด๋ฏ€๋กœ RNN์˜ ์ถœ๋ ฅ์€ ์ด์ „์˜ ๋ชจ๋“  ์ž…๋ ฅ์— ์˜ํ–ฅ..

[RNN] ์ˆœํ™˜ ์‹ ๊ฒฝ๋ง (RNN, Recurrent Neural Network) - 1. ์ˆœ์ฐจ ๋ฐ์ดํ„ฐ

์ˆœํ™˜ ์‹ ๊ฒฝ๋ง์€ ์ž…๋ ฅ์ด๋‚˜ ์ถœ๋ ฅ์„ ์ˆœ์ฐจ ๋ฐ์ดํ„ฐ๋กœ ๋ฝ‘๊ธฐ ์œ„ํ•œ ์‹ ๊ฒฝ๋ง์ด๋‹ค. ๋”ฐ๋ผ์„œ ์ˆœ์ฐจ ๋ฐ์ดํ„ฐ(Sequential Data)์— ๋Œ€ํ•œ ์ดํ•ด๊ฐ€ ํ•„์š”ํ•˜๋‹ค. ์ˆœ์ฐจ๋ฐ์ดํ„ฐ๋ž€? ์ˆœ์„œ๊ฐ€ ๋‹ฌ๋ผ์งˆ ๊ฒฝ์šฐ ์˜๋ฏธ๊ฐ€ ์†์ƒ๋˜๋Š” ๋ฐ์ดํ„ฐ, ์ฆ‰ ์ˆœ์„œ๊ฐ€ ์˜๋ฏธ์žˆ๋Š” ๋ฐ์ดํ„ฐ ์‹œ๊ฐ„์  ์˜๋ฏธ๊ฐ€ ์žˆ๋Š” ๊ฒฝ์šฐ temporal sequence ์ผ์ •ํ•œ ์‹œ๊ฐ„์ฐจ๋ผ๋ฉด time series ex) DNA ์—ผ๊ธฐ ์„œ์—ด(sequential data), ๊ธฐ์˜จ ๋ณ€ํ™”(temporal sequence), ์ƒ˜ํ”Œ๋ง๋œ ์†Œ๋ฆฌ ์‹ ํ˜ธ(time series) โ€ป Resampling (๋ณด๊ฐ„ + ์ƒ˜ํ”Œ๋ง) Temporal Sequence ์‹ ํ˜ธ๋ฅผ Time Series๋กœ ๋ณ€ํ™˜ํ•˜๊ธฐ ์œ„ํ•ด ์‹ ํ˜ธ๋ฅผ ๋ณด๊ฐ„(interpolation)ํ•˜๊ณ  ์ด๋ฅผ ๊ท ์ผ ์‹œ๊ฐ„ ๊ฐ„๊ฒฉ์œผ๋กœ sampling ํ•œ๋‹ค. ์ˆœ์ฐจ ๋ฐ์ดํ„ฐ์™€ ์‹ฌ์ธต ์‹ ๊ฒฝ๋ง ์ˆœ..

728x90