Frey님을 위한 RSS 포스팅 -ㅅ-); ♤ 통계

제목은 좀 거창하네요 -_-);

단계별로 간단하게 샘플링 방법을 적어보겠습니다.



1. 먼저 샘플링 할 갯수를 정한다. (샘플 갯수 = k)

2. 첫번째 set으로써 샘플링 갯 수 만큼 모집단에서 단순임의추출로 뽑는다. 이때 갖게되는 샘플은 k개 이지만 각 샘플의 정확한 수치는 모른다.

3. 실 수치로 정렬을 하는 것이 아니라 시각, 촉각등의 감각적 변수나 concomitant 변수등으로 정렬을 한다.

4. 첫번째 set에서는 가장 작은 값을 첫번째 RSS 샘플로서 뽑는다.

5. 남은 k-1개의 샘플은 반환한다.

6. 두번째 set으로서 k개의 샘플을 단순임의추출로 뽑는다.

7. 같은 방법으로 정렬한 후 이번에는 두번째로 작은 값을 두번째 RSS 샘플로 뽑는다.

8. 남은 k-1개의 샘플은 반환한다.

9. 이와 같은 과정을 총 k개의 샘플을 뽑을 때까지 반복한다.




예를 하나 들어보겠습니다.

두개의 스프레이(하나는 굵은 물방울 입자를 쏘고 다른 하나는 얇은(?) 물방울 입자를 쏘는)를 비교하려고 합니다.

특수한 약품을 각 스프레이를 통해 각각 다른 나무에 뿌립니다.

그 후에 RSS 방법으로 나뭇잎들을 채취하는데 만약 샘플링 갯수가 3개라고 하면

처음 3개의 나뭇잎을 딴 후에 각 나뭇잎에 묻은 약품의 범위 정도를 눈으로 보고 판별하여 정렬합니다.

그래서 가장 적게 묻은 것을 뽑습니다.

두번째 다시 3개의 나뭇잎을 딴 후에 역시 묻은 범위를 눈으로 판별하여 정렬합니다. 이번에는 두번째 것을 뽑습니다.

세번째는 같은 방법으로 가장 많이 묻은 것을 뽑습니다.

그 후에 뽑힌 3개의 나뭇잎의 묻은 정도를 수치화 합니다.


같은 방법으로 다른 나무에도 적용을 합니다. 이렇게 얻어진 총 6개의 샘플(스프레이당 3개)를 비교합니다.


위의 예 같은 경우 나뭇잎에 묻은 정도는 수치화 하기가 힘이 들 것입니다.
모수적 통계 방법으로 비교를 하기 위해서는 적절한 샘플의 수가 보장되어야 하므로 이런 수치화 하는데 비용이 들겠죠.
그렇다면 적은 수의 샘플을 뽑아야 하는데 적은 수를 뽑을 수록 모수적이든 비모수적이든 검정력은 떨어집니다.
그러므로 적은 수의 샘플을 뽑되 해당 집단을 대표할 만큼 적절하게 뽑는 방법으로 RSS가 사용되어집니다.
대체적으로 샘플의 수가 작으므로 연계되어 사용되는 검정법들은 비모수적 방법을 주로 씁니다.

그리고 RSS를 통해 뽑힌 샘플들로 mean을 추정하는 경우 효율이 상당히 좋다고 알려져 있습니다. ^^);


================================================================

도움이 되실지는 모르겠습니다 'ㅅ');;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;

트랙백

이 글과 관련된 글 쓰기 (트랙백 보내기)
TrackbackURL : http://horanya.egloos.com/tb/3778987 [도움말]

덧글

  • Frey 2008/06/10 12:12 # 답글

    감사합니다^^; 제가 설명한게 좀 부족했군요;

    제가 공부하는게 미생물에 의해 만들어진 초(reef)인데, 여기에 완족동물의 화석이 나옵니다. 이 초의 형태가 변하는 것과 함께 생물의 출현 빈도가 변하는 것 같아요. 출현 빈도와 환경을 비교해보려고 하는데 그 화석 숫자가 충분하지 않아서...
  • 불탄五징어 2008/06/10 14:55 #

    아.. 대략적으로 이해했습니다.(60%... OTL)

    저기에는 안 적어 놨지만 RSS의 경우 적절하게 적용하려면 모집단의 크기가 최소 k^2가 가 되어야 합니다. 각 환경에 따른 화석 숫자가 너무 적다면 RSS도 적용하기 힘들 수도 있겠네요. 'ㅅ');;

    정확히 실험(연구)구조가 어떻게 되는지는 모르겠습니다만 각 환경에 따른 화석 수가 적다면
    비모수 검정법을 쓰는게 더 무난할지도 모르곘습니다. 'ㅅ');;;;
  • 미오새 2008/12/18 16:07 # 삭제 답글

    RSS에 관심이 있는데, 개략적인 내용은 알것 같습니다.
    소규모 모집단에서 효율성이 크다고 했는데, 어느정도 규모있는 모집단에서와 계층추출법과 비교시 효율성은 어떤지 알 수 있을지요.
  • 불탄五징어 2008/12/18 18:30 #

    규모가 커질 수록 샘플링을 위해 거치는 과정때문에 시간이 오래 걸립니다.
    그덕에 보통 효율을 이야기하는 ARE가 좋게 나오더라도 실제 샘플링 시간이나
    과정의 문제로 더 효율이 안좋게 나올 수 도 있습니다.

    그리고 계층추출법과는 비교해본적이 없어서 잘 모르겠네요 ^^);
덧글 입력 영역