metoda próbkowania prawdopodobieństwa to każda metoda pobierania próbek, która wykorzystuje pewną formę losowego wyboru. Aby mieć metodę wyboru losowego, musisz skonfigurować jakiś proces lub procedurę, która zapewnia, że różne jednostki w twojej populacji mają równe prawdopodobieństwo wyboru. Ludzie od dawna praktykowali różne formy losowego wyboru, takie jak wybranie imienia z kapelusza lub wybór krótkiej słomy. W dzisiejszych czasach zwykle używamy komputerów jako mechanizmu generowania liczb losowych jako podstawy losowego wyboru.,
niektóre definicje
zanim będę mógł wyjaśnić różne metody prawdopodobieństwa musimy zdefiniować kilka podstawowych terminów. Są to:
-
N
to liczba przypadków w ramce próbkowania -
n
to liczba przypadków w próbce -
NCn
= liczba kombinacji (podzbiorów)n
zN
-
f = n/N
jest ułamkiem próbkowania
to wszystko., Z tych terminów zdefiniowanych możemy zacząć definiować różne metody próbkowania prawdopodobieństwa.
proste losowe pobieranie próbek
najprostsza forma losowego pobierania próbek nazywa się prostym losowym pobieraniem próbek. Dość trudne, co? Oto krótki opis prostego losowego próbkowania:
- cel: aby wybrać
n
jednostki zN
tak, że każdyNCn
ma równe szanse na wybranie. - procedura: Użyj tabeli liczb losowych, komputerowego generatora liczb losowych lub urządzenia mechanicznego, aby wybrać próbkę.,
nieco Szczupła, jeśli jest dokładna, definicja. Zobaczmy, czy uda nam się uczynić to bardziej realnym.
Jak wybrać prostą próbkę losową? Załóżmy, że przeprowadzamy badania z małą agencją usługową, która chce ocenić opinie klientów na temat jakości usług w ciągu ostatniego roku. Najpierw musimy zorganizować próbkę. Aby to osiągnąć, przejrzymy akta agencji, by zidentyfikować każdego klienta z ostatnich 12 miesięcy. Jeśli mamy szczęście, Agencja ma dobre dokładne skomputeryzowane zapisy i może szybko stworzyć taką listę., Więc musimy pobrać próbkę. Zdecyduj się na liczbę klientów, których chcesz mieć w ostatecznej próbce. Dla przykładu, powiedzmy, że chcesz wybrać 100 klientów do badania i że w ciągu ostatnich 12 miesięcy było 1000 klientów. Następnie frakcja próbkowania wynosi f = n/N = 100/1000 = .10
(lub 10%
). Teraz, aby rzeczywiście pobrać próbkę, masz kilka opcji. Możesz wydrukować listę 1000 klientów, rozerwać je na osobne paski, włożyć paski do kapelusza, dobrze je wymieszać, zamknąć oczy i wyciągnąć pierwsze 100., Ale ta mechaniczna procedura byłaby żmudna, a jakość próbki zależałaby od tego, jak dokładnie je pomieszałeś i jak losowo dotarłeś. Być może lepszą procedurą byłoby użycie tego rodzaju maszyny do piłki, która jest popularna w wielu loteriach państwowych. Będziesz potrzebował trzech zestawów kul o numerach od 0 do 9, po jednym zestawie dla każdej z cyfr od 000
do 999
(jeśli wybierzemy 000
nazwiemy to 1000
)., Numeruj listę nazwisk z 1
do 1000
, a następnie użyj Maszyny do piłki, aby wybrać trzy cyfry, które wybierają każdą osobę. Oczywistą wadą jest to, że trzeba uzyskać maszyny piłki. (Gdzie w ogóle to robią? Czy istnieje przemysł maszyn do piłowania?).
żadna z tych procedur mechanicznych nie jest bardzo wykonalna, a wraz z rozwojem niedrogich komputerów istnieje znacznie łatwiejszy sposób. Oto prosta procedura, która jest szczególnie przydatna, jeśli masz już nazwy klientów na komputerze., Wiele programów komputerowych może generować serię losowych liczb. Załóżmy, że możesz skopiować i wkleić listę nazw klientów do kolumny w arkuszu kalkulacyjnym EXCEL. Następnie w kolumnie tuż obok wklej funkcję =RAND()
, która jest sposobem programu EXCEL na umieszczenie losowej liczby pomiędzy 0
I 1
w komórkach. Następnie posortuj obie kolumny-listę nazw i liczbę losową – według liczb losowych. To przestawia listę w kolejności losowej od najniższej do najwyższej liczby losowej., Następnie, wszystko, co musisz zrobić, to wziąć pierwsze sto nazwisk z tej posortowanej listy. całkiem proste. Prawdopodobnie można osiągnąć całość w mniej niż minutę.
proste losowe pobieranie próbek jest proste do wykonania i łatwe do wyjaśnienia innym. Ponieważ proste losowe pobieranie próbek jest sprawiedliwy sposób, aby wybrać próbkę, rozsądne jest uogólnienie wyników z próby z powrotem do populacji. Proste losowe pobieranie próbek nie jest najbardziej efektywną statystycznie metodą pobierania próbek i możesz, tylko ze względu na szczęście losowania, nie uzyskać dobrej reprezentacji podgrup w populacji., Aby poradzić sobie z tymi problemami, musimy zwrócić się do innych metod pobierania próbek.
stratyfikowane losowe pobieranie próbek
stratyfikowane losowe pobieranie próbek, czasami nazywane również proporcjonalnym lub kontyngentowym losowym pobieraniem próbek, polega na podzieleniu populacji na jednorodne podgrupy, a następnie pobraniu prostej próbki losowej w każdej podgrupie. W bardziej formalnych terminach:
istnieje kilka głównych powodów, dla których możesz preferować warstwowe pobieranie próbek niż proste losowe pobieranie próbek., Po pierwsze, zapewnia, że będziesz w stanie reprezentować nie tylko ogólną populację, ale także kluczowe podgrupy populacji, zwłaszcza małe grupy mniejszościowe. Jeśli chcesz być w stanie rozmawiać o podgrupach, może to być jedyny sposób, aby skutecznie zapewnić, że będziesz w stanie. Jeśli podgrupa jest bardzo mała, można użyć różnych ułamków próbkowania (f) w różnych warstwach losowo nad próbki małej grupy (chociaż będziesz musiał ważyć szacunki wewnątrz grupy przy użyciu frakcji próbkowania, gdy chcesz ogólnych szacunków populacji)., Kiedy używamy tej samej frakcji próbkowania w warstwach, prowadzimy proporcjonalne warstwowe losowe pobieranie próbek. Kiedy używamy różnych ułamków próbkowania w warstwach, nazywamy to nieproporcjonalnym stratyfikowanym losowym pobieraniem. Po drugie, warstwowe losowe pobieranie próbek będzie na ogół miało większą dokładność statystyczną niż proste losowe pobieranie próbek. Będzie to prawdą tylko wtedy, gdy warstwy lub grupy są jednorodne. Jeśli tak, spodziewamy się, że zmienność w obrębie grup jest niższa niż zmienność dla całej populacji. Warstwowe pobieranie próbek opiera się na tym fakcie.,
Załóżmy na przykład, że populacja klientów naszej agencji można podzielić na trzy grupy: kaukaską, afroamerykańską i latynoamerykańską. Co więcej, Załóżmy, że zarówno Afroamerykanie, jak i Latynosi są stosunkowo niewielkimi mniejszościami klientów (10%
I 5%
odpowiednio)., Gdybyśmy po prostu zrobili prostą próbkę losową n=100
z ułamkiem próbkowania 10%
, spodziewalibyśmy się tylko przez przypadek, że otrzymamy tylko 10 i 5 osób z każdej z naszych dwóch mniejszych grup. I, przez przypadek, możemy dostać mniej niż to! Jeśli się rozwarstwimy, możemy zrobić coś lepszego. Najpierw ustalmy, ile osób chcemy mieć w każdej grupie. Załóżmy, że nadal chcemy pobrać próbkę 100 z populacji 1000 klientów w ciągu ostatniego roku. Ale uważamy, że aby powiedzieć cokolwiek o podgrupach, będziemy potrzebować co najmniej 25 przypadków w każdej grupie., Spróbujmy 50 rasy kaukaskiej, 25 Afroamerykanów i 25 Latynosów. Wiemy, że 10% populacji, czyli 100 klientów, to Afroamerykanie. Jeśli losowo spróbujemy 25 z nich, mamy ułamek próbkowania wewnątrz warstwy 25/100 = 25%
. Podobnie wiemy, że 5% lub 50 klientów to Latynosi-Amerykanie. Tak więc nasza frakcja próbkowania wewnątrz warstwy będzie 25/50 = 50%
. Wreszcie, po odjęciu wiemy, że jest 850 klientów rasy kaukaskiej. Nasza frakcja próbkowania wewnątrz warstwy dla nich to 50/850 = about 5.88%
., Ponieważ grupy są bardziej jednorodne wewnątrz grupy niż w całej populacji jako całości, możemy spodziewać się większej precyzji statystycznej (mniej wariancji). A ponieważ jesteśmy stratyfikowani, wiemy, że będziemy mieli wystarczająco dużo przypadków z każdej grupy, aby wnioskować znaczące podgrupy.,e są kroki, które należy wykonać, aby uzyskać systematyczną próbkę losową:
- liczba jednostek w populacji z
1
doN
- Zdecyduj na
n
(Rozmiar próbki), które chcesz lub potrzebujesz - losowo wybierz liczbę całkowitą między
1
dok
- następnie weź każdy
kth
Jednostka
i k = N/n
= rozmiar interwału
wszystko to będzie dużo jaśniejsze na przykładzie., Załóżmy, że mamy populację, która ma tylko N = 100 osób w nim i że chcesz pobrać próbkę n = 20. Aby korzystać z systematycznego pobierania próbek, populacja musi być wymieniona w losowej kolejności. Frakcja pobierania próbek wynosiłaby f = 20/100 = 20%
. w tym przypadku rozmiar interwału k
jest równy N/n = 100/20 = 5
. Teraz wybierz losową liczbę całkowitą z 1 to 5
. W naszym przykładzie wyobraź sobie, że wybrałeś 4
., Teraz, aby wybrać próbkę, zacznij od jednostki 4th
na liście i weź każdą jednostkę k-th
(co 5, ponieważ k=5). Próbkujesz jednostki 4, 9, 14, 19 i tak dalej do 100, a skończysz z 20 jednostkami w próbce.
aby to zadziałało, ważne jest, aby jednostki w populacji były losowo uporządkowane, przynajmniej w odniesieniu do cech, które mierzysz. Dlaczego w ogóle chcesz używać systematycznych losowych prób? Po pierwsze, jest to dość łatwe do zrobienia. Aby rozpocząć, wystarczy wybrać jedną losową liczbę., Może to być również bardziej precyzyjne niż proste losowe pobieranie próbek. Wreszcie, w niektórych sytuacjach po prostu nie ma łatwiejszego sposobu na losowe pobieranie próbek. Na przykład, kiedyś musiałem zrobić badanie, które wymagało pobierania próbek ze wszystkich książek w bibliotece. Po wybraniu, musiałbym pójść na półkę, zlokalizować książkę i nagrać, kiedy ostatni raz krąży. Wiedziałem, że mam dość dobrą ramkę próbkowania w postaci listy półek (czyli katalogu kartkowego, w którym wpisy są ułożone w kolejności, w jakiej występują na półce)., Aby zrobić prostą próbkę losową, mogłem oszacować całkowitą liczbę książek i wygenerować losowe liczby, aby narysować próbkę; ale jak łatwo znaleźć książkę # 74,329, jeśli jest to liczba, którą wybrałem? Nie mogłem policzyć kart, dopóki nie doszedłem do 74,329! Stratyfikacja też nie rozwiąże tego problemu. Na przykład mogłem rozwarstwić szufladę katalogu kart i narysować prostą losową próbkę w każdej szufladzie. Ale i tak utknąłbym w liczeniu kart. Zamiast tego zrobiłem systematyczną próbkę losową. Oszacowałem liczbę książek w całej kolekcji. Wyobraźmy sobie, że to było 100,000., Zdecydowałem, że chcę pobrać próbkę 1000 dla ułamka próbkowania 1000/100,000 = 1%
. Aby uzyskać interwał próbkowania k
, podzieliłem N/n = 100,000/1000 = 100
. Następnie wybrałem losową liczbę całkowitą pomiędzy 1
I 100
. Powiedzmy, że mam 57
.
następnie zrobiłem małe badanie poboczne, aby określić, jak gruba jest tysiąc kart w katalogu kart (biorąc pod uwagę różny wiek kart)., Powiedzmy, że średnio znalazłem, że dwie karty, które były oddzielone 100
karty były o .75
cali od siebie w szufladzie katalogu. Ta informacja dała mi wszystko, czego potrzebowałem, by pobrać próbkę. Liczyłem na 57. ręcznie i zapisałem informacje o książce. Potem wziąłem kompas. (Pamiętasz te z klasy matmy? To zabawne, małe metalowe instrumenty z ostrą szpilką na jednym końcu i ołówkiem na drugim, których używałeś do rysowania kółek na lekcji geometrii.,) Następnie ustawiłem kompas na .75"
, wbiłem końcówkę pinu na 57 kartę i skierowałem ołówkiem koniec na następną kartę (około 100 książek dalej). W ten sposób przybliżyłem wybór 157., 257., 357. i tak dalej. Udało mi się przeprowadzić całą procedurę selekcji w bardzo krótkim czasie, wykorzystując to systematyczne podejście do losowego pobierania próbek. Pewnie nadal byłabym tam licząc karty, gdybym spróbowała innej metody losowego pobierania próbek. (OK, więc nie mam życia. Nieźle mi wynagrodzili, że wymyśliłem ten plan.,)
Klaster (obszar) losowe pobieranie próbek
problem z losowych metod pobierania próbek, gdy mamy do próbki populacji, która jest wypłacane w całym szerokim regionie geograficznym jest to, że trzeba będzie pokryć dużo ziemi geograficznie, aby dostać się do każdej z jednostek, które próbkowane. Wyobraź sobie, biorąc prostą losową próbkę wszystkich mieszkańców stanu Nowy Jork w celu przeprowadzenia osobistych wywiadów. Dzięki losowaniu skończysz z respondentami, którzy pochodzą z całego stanu. Twoi rozmówcy będą mieli dużo podróży do zrobienia., Właśnie dla tego problemu wynaleziono losowe próbkowanie klastra lub obszaru.
w próbkowaniu klastrów wykonujemy następujące kroki:
- podziel populację na klastry (zwykle wzdłuż granic geograficznych)
- losowo próbkowane klastry
- zmierz wszystkie jednostki w próbkowanych klastrach
na przykład na rysunku widzimy mapę hrabstw w stanie Nowy Jork. Załóżmy, że musimy przeprowadzić badanie władz miast, które będzie wymagało od nas osobistego wyjazdu do miast., Jeśli zrobimy prostą próbkę losową w całym stanie, będziemy musieli pokryć cały stan geograficznie. Zamiast tego decydujemy się na pobranie klastra pięciu powiatów (zaznaczonych na czerwono na rysunku). Po ich wybraniu, udamy się do każdego rządu miasta w pięciu obszarach. Oczywiście ta strategia pomoże nam zaoszczędzić na naszym przebiegu. Pobieranie próbek klastra lub obszaru jest przydatne w takich sytuacjach i odbywa się przede wszystkim dla wydajności administracji., Należy również pamiętać, że prawdopodobnie nie musimy martwić się o korzystanie z tego podejścia, jeśli przeprowadzamy ankietę mailową lub telefoniczną, ponieważ nie ma znaczenia tak wiele (lub kosztuje więcej lub podnosi nieefektywność), do którego dzwonimy lub wysyłamy listy.
próbkowanie Wieloetapowe
cztery metody, które omówiliśmy do tej pory-proste, stratyfikowane, systematyczne i klastrowe – to najprostsze strategie losowego pobierania próbek. W większości rzeczywistych badań społecznych stosowanych, użylibyśmy metod pobierania próbek, które są znacznie bardziej złożone niż te proste odmiany., Najważniejszą zasadą jest tutaj to, że możemy łączyć proste metody opisane wcześniej na wiele użytecznych sposobów, które pomagają nam zaspokoić nasze potrzeby pobierania próbek w najbardziej efektywny i skuteczny sposób. Kiedy łączymy metody pobierania próbek, nazywamy to próbkowaniem wieloetapowym.
na przykład rozważ pomysł pobierania próbek dla mieszkańców stanu Nowy Jork w celu wywiadów twarzą w twarz. Oczywiście chcielibyśmy zrobić pewien rodzaj próbkowania klastra jako pierwszy etap procesu. Możemy spróbować miasteczek lub spisów w całym stanie., Ale w próbkowaniu klastra będziemy następnie zmierzyć wszystkich w wybranych przez nas klastrach. Nawet jeśli pobieramy próbki spisu, możemy nie być w stanie zmierzyć każdego, kto znajduje się w spisie. Możemy więc ustawić warstwowy proces próbkowania w klastrach. W tym przypadku mamy dwustopniowy proces pobierania próbek z próbkami warstwowymi w próbkach klastrowych. Lub rozważ problem pobierania próbek uczniów w szkołach podstawowych. Możemy zacząć od próby krajowej okręgów szkolnych podzielonych według poziomu ekonomicznego i edukacyjnego., W wybranych okręgach możemy wykonać prostą, losową próbę szkół. W szkołach możemy zrobić prostą losową próbkę klas lub ocen. I, w ramach zajęć, możemy nawet zrobić prostą losową próbkę uczniów. W tym przypadku mamy trzy lub cztery etapy w procesie pobierania próbek i używamy zarówno stratyfikowanego, jak i prostego losowego pobierania próbek. Łącząc różne metody pobierania próbek jesteśmy w stanie osiągnąć bogatą różnorodność probabilistycznych metod pobierania próbek, które mogą być stosowane w szerokim zakresie kontekstów badań społecznych.