Processing math: 68%
본문 바로가기
각종공부/통계

표본분산 공식에서 n 대신 n-1을 사용하는 이유

by 달슬 2020. 6. 13.
반응형

표본분산 공식

s2=(xi¯x)2n1

에서 분모는 왜 n이 아니라 n-1일까?

 

이는 (xi¯x)2n1로 나누어야 표본분산의 기대치가 모분산이 되기 때문이다.

(n-1을 사용해야 표본분산이 모분산의 불편추정치가 된다!)

 

모평균과 모분산이 μ,σ2를 따르는 분포에서 관측한 x1,,xn에 대하여

 

표본평균은

¯x=xin이고,

 

표본평균의 평균과 분산은

E(¯x)=μ,Var(¯x)=σ2n이다.

 

이 경우 표본분산 s2을  s2=(xi¯x)2n1이라 하는 이유는

E[s2]=E[(xi¯x)2n1]=1n1E[(xi¯x)2]

               =1n1E[(x2i2xi¯x+¯x2)]

               =1n1E[(x2i)2¯x(xi)+n¯x2)]

               =1n1E[(x2i)n¯x2]

               =1n1{[E(x2i)]nE(¯x2)}

               =1n1{[σ2+μ2]n(σ2n+μ2)}

                 (

                         Var(\overline{X})\: =\: \frac{\sigma ^2}{n}\: =\: E[\overline{X}^{2}]-E[\overline{X}] ^2\: =\: E[\overline{X}^{2}]-\mu ^2)

               =\: \frac{1}{{n-1}}\left \{ n\sigma ^2 +n\mu ^2-\sigma ^2 -n\mu ^2) \right \}

               =\: \frac{1}{{n-1}}(n\sigma ^2 -\sigma ^2 )\: =\: \frac{1}{{n-1}}(n-1)\sigma ^2

               =\: \sigma ^2

 

즉,

이기 때문이다.

 

따라서, s^2이 미지의 모분산 \sigma ^2에 대해 좋은 추정치이기 때문에, 표본분산 공식에서는 n 대신 n-1을 사용한다.

반응형

댓글