본문 바로가기
Science & A.I./Astronomy

Statistical error analysis (The error of the mean)

by 화이트홀N 2020. 3. 31.

Lee et al. 2015 (https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4452664/)

 

1) 목표

  관측한 결과를 분석하여 모분포의 특징(평균, 표준편차 등)을 알고 싶다.

  더불어 각 특징을 예측할때의 에러를 함께 제시한다.

 

 

2) 실험

   위 그림의 분포 A를 추측하기 위해 B처럼 N번의 실험을 수행하였다.

  각각의 실험은 n번의 측정 데이터를 얻은 것이다.

  

 

3) 실험별 분석

  각 실험마다 아래와 같이 평균과 표준편차를 구할 수 있다.

Lee et al. 2015 (https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4452664/)

 

4) 모분포 평균의 예측

  이때 각 실험별 평균값의 분포는 Normal distribution이다. 이는 개개의 Sample이 어떤 분포이든지 무관하다. (Central limit theorem)

따라서 실험별 평균값의 평균으로 모분포의 평균을 예측할 수 있고,

  그 때의 에러 즉 평균을 구할때의 에러 (The Error of the mean = The error in the mean = Stardard error)는 실험별 표준편차가 전파된 값 (error propagation)이다.

 

 

5) 최종 분석 (측정오차가 동일하거나 없는 경우)

 대부분의 경우 n개의 측정을 N번하지 않고, N개의 측정을 1회하여 모분포의 평균을 예측한다.

 이때 우리는 개개의 측정을 B에서의 개개의 실험으로 생각하고 분석하는데, 각 실험의 Mean은 데이터의 측정값, 표준편차는 데이터의 측정오차로 간주하면 된다. 

  또한 데이터별로 측정오차가 없다면 측정오차가 측정데이터 분포의 표준편차로 동일하다고 가정할 수 있다.  식 (4.13)

  달리말하면 표준편차 (측정오차)가 동일한 N번의 실험을 했다는 것을 의미한다.

 

  따라서 모분포의 평균은 데이터의 평균이고,

             모분포 평균을 구할 때 에러는 데이터의 표준편차를 데이터의 개수의 제곱근으로 나눈 값으로부터 얻을 수 있다. 식 (4.14)

 

  자세한 설명은 아래의 Bevington의 본문에 체계적으로 소개되어 있다.

Chapter 4 of "Data Reduction and Error Analysis for the Physical Sciences" by Bevington

 

 

6) 최종 분석 (일반화-측정오차가 다른 경우)

  개개 측정의 오차가 다른 경우는 단순히 위의 5)와 같은 방식으로 구할 수 없다. 이 경우는 Erorr-weighted 값을 사용해야 한다.

  모분포의 평균은 Error-weigthed mean 식 (4.17),

  모분포 평균을 구할때 에러는 Error in the Weighted Mean 식 (4.19)를 이용한다.

 

  자세한 설명은 아래의 Bevington의 본문에 체계적으로 소개되어 있다.

Chapter 4 of "Data Reduction and Error Analysis for the Physical Sciences" by Bevington

댓글