Median ranked ordering set sampling(MROSS) ♤ 통계

심심해서 제 졸업논문을 주제로 이야기하고자 합니다.

예전에도 포스팅 했었는데 각 표본으로 뽑힐 unit들을 측정하는데 상당한 비용이 들거나 적은 표본으로도 충분한 효과를 보고자 할 때 Ranking을 이용한 sampling 방법이 효과적입니다. 대표적인 예가 Ranked set sampling(McIntyre)로 줄여서 RSS라고도 부릅니다.

McIntyre가 제시한 이후로 이 sampling을 기반으로 여러 통계적 방법이 제시 되었는데 보통 접하기 쉬운 모수적 통계방법 외에 비모수적 통계방법에 주로 많이 다루어 졌습니다. 랩 선배님들의 말씀을 인용하면 "국내에서 이 sampling로 classical nonparametric statistics를 연구하는 건 우리 랩 뿐이다."라고 하시더군요. 좋게 말하면 독보적인거고 나쁘게 말하면 뭐....

이후에 RSS를 기반으로해서 ERSS, ORSS등 여러 샘플링이 만들어졌습니다. 그 중에서 발전된 형태의 sampling방법이 Ranked ordering set sampling(김현기)입니다. 다른 RSS의 변형 샘플링과는 달리 RSS에서 요구하는 observation의 수(k^2)로 더 효율적인 sampling이 가능한 방법입니다.

ROSS를 기반으로 한 sampling 방법이 제논문에서 쓰인 Median ranked ordering set sampling입니다. 사실 ROSS이상의 단계를 가지는 샘플링 방법은 개인적으로 볼 때 샘플링의 복잡한 과정으로 득보다는 실이 더 많이 보입니다. 그래서 이론적인 연구로서의 가치밖에는 없다고 생각합니다.



k개의 샘플을 얻는 MROSS  방법은 다음과 같습니다.

1. 하나의 set으로 ROSS를 통해 k개의 샘플을 얻는다.
 
       

2. 이를 총 n개 반복하고 그 결과 우리는 k×n 개의 ROSS 샘플을 얻는다.

       

3. i-ordered ranking을 갖는 샘플 들 중에서 median값을 i-th median ordered ranking 샘플로 취한다.

       

샘플링 구조는 다음과 같다.




 비록 세번째 단계에서 median을 쓰지만 엄밀히 말해서 총 3번의 ordering 과정을 거칩니다. 즉 샘플링 과정이 복잡하고 샘플링과정을 거치기 위한 observation의 요구량이 많으므로 소표본 샘플링이 가지는 이점이 없어집니다. 예로 3개의 샘플을 5번의 cycle로 MROSS를 하게 되면 필요 observation은 k×k×n=3×3×5=45개로 (보통 30개 이상이면 CLM에 의해 정규분포로 가정하는 것을 고려하면) 샘플링의 의미가 없어지게 된다.

 하지만 이론적이긴 하나 MROSS를 바탕으로 johnkeere type의 순서대립가설 검정 시 RSS, ROSS를 기반으로 한 경우보다 높은 검정력과 ARE을 보여주고 있으니 논문으로 쓸수 있었다. 

 실제 논문 주제로 잡고 있던건 다른 내용(Otzurk의 ORR에 관한 것)이었으나 이해가 부족한데다가 시간이 촉박해서 포기했었는데 지나고 나니 조금 아쉽기는 하다.(물론 또 쓰고 싶진 않다.. ㅎㄷㄷ)




트랙백

이 글과 관련된 글 쓰기 (트랙백 보내기)
TrackbackURL : http://horanya.egloos.com/tb/3949262 [도움말]

덧글

댓글 입력 영역