์๋ ๋ชฉํ:s(x)=โxlogp(x)
s(x)=โxlogโกp(x)s(x) = \nabla_x \log p(x)
์ด ์ค์ฝ์ด ํจ์(์ง์ง ๋ถํฌ์ ๊ธฐ์ธ๊ธฐ)๋ฅผ ์๊ณ ์ถ๋ค โ ๊ทธ๋ฐ๋ฐ ๋ชจ๋ฅด๋๊น ์ง์ GT๋ก ๋ชป ์.
์ฐ๋ฆฌ๊ฐ ๋ฐ์ดํฐ๋ฅผ ์ผ๋ถ๋ฌ ์ค์ผ์ํจ๋ค โx~=x+ฯz,zโผN(0,I)
x~=x+ฯz,zโผN(0,I)\tilde{x} = x + \sigma z, \quad z \sim \mathcal{N}(0, I)
์ฌ๊ธฐ์ zzz๋ ์ฐ๋ฆฌ๊ฐ ์ง์ ์ํ๋งํ ๋ ธ์ด์ฆ๋ผ์ ์ ํํ ์ด๋ค ๋ฐฉํฅ์ผ๋ก ์ง์ด๋ฃ์๋์ง โ์ ๋ตโ์ ์๊ณ ์์.
๋คํธ์ํฌ sฮธ(x~)s_\theta(\tilde{x})sฮธ(x~)๊ฐ
โx~\tilde{x}x~์์ ์๋ ๋ฐ์ดํฐ xxx ์ชฝ์ผ๋ก ์ด๋ํ๋ ๋ฒกํฐโ๋ฅผ ์ถ์ ํ๋๋ก ๋ง๋ฆ.
์ฆ, ๋ ธ์ด์ฆ ์ ๊ฑฐ ๋ฐฉํฅ์ ์์ธกํ๊ฒ ํจ.
์ด๋ ์ค์ ์ ๋ต์ ์ฐ๋ฆฌ๊ฐ ์๋ ๊ฐ:ฯ21(xโx~)
1ฯ2(xโx~)\frac{1}{\sigma^2}(x - \tilde{x})
โ ์๋ํ๋ฉด x~โx\tilde{x} - xx~โx๊ฐ ์ฐ๋ฆฌ๊ฐ ์ถ๊ฐํ ๋ ธ์ด์ฆ๋๊น!