Chapter-1 Introduction
Last updated
Was this helpful?
Last updated
Was this helpful?
์ฌ๋์ ์๊ธ์จ๊ฐ ๋ด๊ธด ์ซ์์ ์ด๋ฏธ์ง๋ก ์ด๋ค ์ซ์์ธ์ง๋ฅผ ํ๋ณํ๋ "์๊ธ์จ ์ธ์" ์๊ณ ๋ฆฌ์ฆ์ ์์ฑํด๋ณด์.
ํด๋ฆฌ์คํฑํ ๊ท์น(handcrafted rules or heuristics)์ผ๋ก๋ ๋ง๋ค ์ ์์ง๋ง, ๊ท์น์ ์๋ฐ๋๋ ๊ฒ์ด๋ ์กฐ๊ธ๋ง ์์ ์ธ์ ๋ฐ์ดํฐ๊ฐ ๋ค์ด์ค๋ฉด ์์ฃผ ํํธ์๋ ๊ฒฐ๊ณผ๋ฅผ ์ป์ ๊ฒ์ด๋ค.
๋จธ์ ๋ฌ๋์ ๊ด์ ์ผ๋ก ์ ๊ทผํ๊ฒ ๋๋ฉด ๋ ์ข์ ๊ฒฐ๊ณผ๋ฅผ ์ป์ ์์๋ค. ๊ทธ์ ์ ๋จธ์ ๋ฌ๋์ผ๋ก ์ด๋ป๊ฒ ์ ๊ทผํ๋์ง ์ดํด๋ณธ๋ค.
๋ณดํต ์๋ ์ฃผ์ด์ง ์ ๋ ฅ ๋ฐ์ดํฐ๋ ์ ์ฒ๋ฆฌ(preprocessed) ํน์ ํผ์ณ์ถ์ถ(feature extraction) ๊ณผ์ ์ ๊ฑฐ์ณ ์๋ก์ด ๊ณต๊ฐ(space, ์๋ง ๋ฒกํฐ๊ณต๊ฐ?)์ผ๋ก ๋ณํ๋๋ค. ์ด๋ฅผ ํตํด์ ์กฐ๊ธ๋ ์ฝ๊ฒ ํจํด์ธ์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธธ ๊ธฐ๋ํ๋ค. ์์ ์์๋ก ๋ค์๋ฉด, ์ด๋ฏธ์ง๋ผ๋ ๊ทธ๋ฆผ ํ์ผ์ ๊ณ ์ ๋ ํฌ๊ธฐ์ ์ค์ผ์ผ๋ง๋ ์ซ์๋ก ๋ณํ ํ๋ ์์ ์ด ์ ์ฒ๋ฆฌ๊ณผ์ ์ ๋ปํ๋ค. (Mnist ๋ฐ์ดํฐ ์ ์ 0~255 ์ซ์์์ 0๊ณผ 1์ฌ์ด๋ก ๋ ธ๋ง๋ผ์ด์ง์ ํ๋ค.) ์๋ก์ด ๋ฐ์ดํฐ ๋ํ ์ ์ฒ๋ฆฌ / ํผ์ฒ์ถ์ถ ๊ณผ์ ์ ๊ฑฐ์ณ์ผํ๋ค. ์ ์ฒ๋ฆฌ๊ณผ์ ์ ์ฅ์ ์ ํ์ต์ ์ฝ๊ฒ ํ ๋ฟ๋ง ์๋๋ผ, ๊ณ์ฐ์ ๋ ๋น ๋ฅด๊ฒ ํ๋ ๊ฒ๋ ์๋ค. ์ค์๊ฐ ์ผ๊ตด์ธ์์ ์๋ก ๋ค์๋ฉด, ์ ์ด๋ง๋ค ์์ฒญ๋ง ํฝ์ ์ ์ฒ๋ฆฌํด์ผํ๋๋ฐ, ์ง์ ์๋ณธ ๋ฐ์ดํฐ๋ฅผ ์์ ํ๋๊ฒ ๋ณด๋ค๋ ์ธ๋ชจ์๋ ์ ๋ณด๋ ๋ฒ๋ฆฌ๊ณ ์ ์ฉํ ํผ์ณ(features) ๋ฅผ ์ถ์ถํด์ ๋น ๋ฅด๊ฒ ๊ณ์ฐํ๋ ๊ฒ์ด ์ข๋ค.
ํ์ง๋ง ์ ์ฒ๋ฆฌ ๋จ๊ณ์์ ๋งค์ฐ ์กฐ์ฌ์ค๋ฝ๊ฒ ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํด์ผํ๋ค. ๊ทธ ์ด์ ๋ ๋ณดํต ์ ํ๋ ํผ์ฒ๋ค์ ๊ธฐ์กด์ ๋ฐ์ดํฐ๋ณด๋ค ์ฐจ์์ด ์๊ธฐ ๋๋ฌธ์, ์ ํ๊ณผ์ ์ค์์ ์ฐ๋ฆฌ๊ฐ ์ก์ง ๋ชปํ ์ ๋ณด์์ค์ด ์ผ์ด๋ ์ ์๊ธฐ ๋๋ฌธ์ด๋ค. ๋ง์ฝ ์ฐ๋ฆฌ๊ฐ ๋ฒ๋ฆฐ ํผ์ฒ๊ฐ ์ด๋ค ์ผ์ ์ํํ๋๋ฐ ์ค์ํ ํผ์ฒ์๋ค๋ฉด, ๊ต์ฅํ ์ฑ๋ฅ์ ์ฌ๊ฐํ ์ํฅ์ ๋ผ์น๊ฒ ๋๋ค.
์ง๋ํ์ต(supervised learning) ๋ฌธ์ ๋ ๊ฐ ์ ๋ ฅ๊ฐ(๋ฒกํฐ)์ ์์ํ๋ ํ๊ฒ๊ฐ(๋ฒกํฐ)๊ฐ ์๋ ๋ฌธ์ ๋ฅผ ๋งํ๋ค.
ํ์ต๋ชฉํ๊ฐ ํ์ ๋ ์ด์ฐํ ์นดํ ๊ณ ๋ฆฌ ๊ฐ์ด๋ผ๋ฉด ๋ถ๋ฅ(classification) ๋ฌธ์ ๋ค.
ํ์ต๋ชฉํ๊ฐ ์ฐ์ํ ๋ณ์๋ผ๋ฉด ํ๊ท(regression) ๋ฌธ์ ๋ค.
๋น์ง๋ํ์ต(unsupervised learning) ๋ฌธ์ ๋ ์ ๋ ฅ๊ฐ(๋ฒกํฐ)์ ์์ํ๋ ํ๊ฒ๊ฐ(๋ฒกํฐ)๊ฐ ์๋ ๋ฌธ์ ๋ฅผ ๋งํ๋ค.
๋ฐ์ดํฐ์์ ๋น์ทํ ์์ฑ์ ๊ฐ์ง๋ ๊ทธ๋ฃน์ ์ฐพ๋ ๋ฌธ์ ๋ ํด๋ฌ์คํฐ๋ง(clustering) ์ด๋ผ๊ณ ํ๋ค.
๊ณ ์ฐจ์ ๊ณต๊ฐ(high-demensional space)์ ๋ฐ์ดํฐ๋ฅผ 2 ํน์ 3 ์ฐจ์ ๊ณต๊ฐ์ ํฌ์ํ์ฌ ๋ณด์ฌ์ฃผ๋ ๊ฒ์ ์๊ฐํ(visualization) ์ด๋ผ๊ณ ํ๋ค.
๊ฐํํ์ต(reinforcement learning) ๋ฌธ์ ๋ ์ฃผ์ด์ง ์ํฉ์์ ์ ์ผ ํฐ ๋ณด์์ ์ป๋ ๋ฐฉํฅ์ผ๋ก ์ ์ผ ์ ์ ํ ํ๋(action)์ ์ฐพ๋ ๋ฌธ์ ๋ฅผ ๋งํ๋ค.
๋ง์ฐฌ๊ฐ์ง๋ก ์ต์ ๊ฒฐ๊ณผ๊ฐ์ ๊ธฐ๊ณ์๊ฒ ์ ์ํ์ง ์๋๋ค.
ํน์ง ์ค ํ๋๋ ํ์(exploration, ํจ์จ์ ์ธ ์๋ก์ด ํ๋์ ์ฐพ๋ ๊ฒ)๊ณผ ํ์ฉ(exploitation, ๋์ ๋ณด์์ ์ฃผ๋์ชฝ์ผ๋ก ํ๋ํ๋ ๊ฒ)์ trade-off ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ๊ฒ์ด๋ค.
์ฃผ์ด์ง ์ด๋ฏธ์ง๋ค, ์ฆ i ๋ฒ์งธ์ ์ด๋ฏธ์ง๋ฅผ ๋ผ๊ณ ํ๋ฉด, ์ด๋ค์ ๋ชจ๋ ๋ชจ์ ๊ฐ์ ๋ฐ์ดํฐ๋ฅผ ํ๋ จ ์ธํธ(training set) ์ด๋ผ๊ณ ํ๋ค. () ํ๋ จ๋ฐ์ดํฐ๋ฅผ ํตํด์ ํ๋ผ๋ฏธํฐ๋ฅผ ์กฐ์ ํด ์ ์ ํ ๋ชจ๋ธ์ ์ป์ ๊ฒ์ด๋ค.
i ๋ฒ์งธ์ ์ด๋ฏธ์ง()์ ํด๋นํ๋ ํ๋์ ์ซ์ ์นด๋ฐ๊ณ ๋ฆฌ๊ฐ ์์ ๊ฒ์ด๋ค.์ด๋ฅผ ํ๊ฒ๋ฒกํฐ(target vector) ์ด๋ผ๊ณ ํ๋ค.
์ด ๋จธ์ ๋ฌ๋ ์๊ณ ๋ฆฌ์ฆ์ ๊ฒฐ๊ณผ๋ฌผ์ ์ด๋ค ํจ์ ๋ก ํํํ ์ ์๋ค. ์ซ์ ์ด๋ฏธ์ง ๋ฅผ ์ ๋ ฅ ๋ฒกํฐ๋ก ๋ฐ๊ณ , ์ถ๋ ฅ ๋ฒกํฐ ๋ฅผ ์์ฑํด๋ธ๋ค. ๋ํ, ํจ์ ์ ํํ๋ ํ๋ จ๋จ๊ณ(training phase) ํน์ ํ์ต๋จ๊ณ(learning phase) ์์ ๊ฒฐ์ ๋๋ค. ํ์ต๋จ๊ณ๋ฅผ ๊ฑฐ์ณ ํฅํ์ ์๋ก์ด ์ซ์ ์ด๋ฏธ์ง๋ฅผ ํ๋ ํ ๋, ์ด ์๋ก์ด ์ด๋ฏธ์ง๋ค(๋ฐ์ดํฐ๋ค)์ ํ ์คํธ ์ธํธ(test set) ๋ผ๊ณ ํ๋ค.
ํด๋น ํจ์ ๊ฐ ๊ธฐ์กด์ ํ๋ จ๋จ๊ณ์ ์ฌ์ฉ๋์ง ์์ ์๋ก์ด ์ด๋ฏธ์ง๋ฅผ ๋ฐ์์ ์ผ๋งํผ ์ ์ซ์๋ฅผ ํ๋ณํ๋ ๋ฅ๋ ฅ์ ์ผ๋ฐํ(generalization) ์ด๋ผ๊ณ ํ๋ค. ๊ทธ๋ฌ๋, ์ฐ๋ฆฌ๊ฐ ํ๋ จ์ ์ฌ์ฉํ๋ ์ ๋ ฅ ๋ฒกํฐ๋ ์ ์ฒด(์ค์ ์ธ์์ ์กด์ฌํ๋ ๋ชจ๋ ์ซ์์ด๋ฏธ์ง ์ ๋ ฅ๋ฒกํฐ)์์ ๊ทนํ ์์ ์ผ๋ถ๋ถ ๋ฟ์ด๋ค. ๋ฐ๋ผ์ ์ด ์ผ๋ฐํ๊ฐ ํจํด์ธ์์ ์ฃผ์ ๋ชฉํ๋ผ๊ณ ํ ์ ์๋ค.
์ ๋ ฅ ๋ฐ์ดํฐ๋ก ๋ณ์์ ๋ถํฌ๋ฅผ ๋์ถ(๊ฒฐ์ )ํด๋ด๋ ๋ฌธ์ ๋ฅผ ๋ฐ๋ ์ถ์ (density estimation) ์ด๋ผ๊ณ ํ๋ค. (๋ณ์ ์ ๋ ฅ๋ฐ์ดํฐ)