o metodă de eșantionare a probabilității este orice metodă de eșantionare care utilizează o formă de selecție aleatorie. Pentru a avea o metodă de selecție aleatorie, trebuie să configurați un proces sau o procedură care să asigure că diferitele unități din populația dvs. au probabilități egale de a fi alese. Oamenii au practicat mult timp diferite forme de selecție aleatorie, cum ar fi alegerea unui nume dintr-o pălărie sau alegerea paiului scurt. În aceste zile, avem tendința de a folosi computerele ca mecanism de generare a numerelor aleatorii ca bază pentru selecția aleatorie.,
unele definiții
înainte de a putea explica diferitele metode de probabilitate, trebuie să definim câțiva termeni de bază. Acestea sunt:
-
N
este numărul de cazuri din baza de eșantionare -
n
este numărul de cazuri în eșantion -
NCn
= numărul de combinații (subseturi) den
de laN
-
f = n/N
este de eșantionare fracțiune
Asta este., Cu acești termeni definiți, putem începe să definim diferitele metode de eșantionare a probabilităților.
eșantionare aleatorie simplă
cea mai simplă formă de eșantionare aleatorie se numește eșantionare aleatorie simplă. Destul de complicat, nu? Aici este o scurtă descriere de eșantionare aleatoare simplă:
- Obiectiv: Pentru a selecta
n
unități deN
astfel că fiecareNCn
are o șansă egală de a fi selectat. - procedura: utilizați un tabel de numere aleatorii, un generator de numere aleatorii de calculator sau un dispozitiv mecanic pentru a selecta eșantionul.,
o definiție oarecum stilată, dacă este exactă. Să vedem dacă putem face un pic mai real.
cum selectăm un eșantion aleatoriu simplu? Să presupunem că facem unele cercetări cu o mică agenție de servicii care dorește să evalueze opiniile clienților cu privire la calitatea serviciilor în ultimul an. În primul rând, trebuie să organizăm cadrul de eșantionare. Pentru a realiza acest lucru, vom parcurge înregistrările Agenției pentru a identifica fiecare client în ultimele 12 luni. Dacă avem noroc, Agenția are înregistrări computerizate precise și poate produce rapid o astfel de listă., Apoi, trebuie să extragem eșantionul. Decideți numărul de clienți pe care doriți să îl aveți în eșantionul final. De dragul exemplului, să presupunem că doriți să selectați 100 de clienți pentru sondaj și că au existat 1000 de clienți în ultimele 12 luni. Apoi, fracția de eșantionare este f = n/N = 100/1000 = .10
(sau 10%
). Acum, pentru a desena eșantionul, aveți mai multe opțiuni. Ai putea imprima de pe lista de 1000 de clienti, rupe apoi în benzi separate, a pus benzile într-o pălărie, se amestecă-le foarte bine, închide ochii și scoate primul 100., Dar această procedură mecanică ar fi obositoare, iar calitatea eșantionului ar depinde de cât de bine le-ați amestecat și de cât de aleatoriu ați ajuns. Poate că o procedură mai bună ar fi de a utiliza un fel de mașină cu bile, care este popular cu multe dintre loterii de stat. Ai nevoie de trei seturi de bile numerotate de la 0 la 9, un set pentru fiecare dintre cifrele de la 000
și 999
(dacă vom selecta 000
vom numi asta 1000
)., Numărul de lista de nume de la 1
și 1000
și apoi utilizați mingea mașină pentru a selecta cele trei cifre care selectează fiecare persoană. Dezavantajul evident aici este că aveți nevoie pentru a obține mașinile cu bile. (În cazul în care fac aceste lucruri, oricum? Există o industrie de mașini cu bile?).nici una dintre aceste proceduri mecanice nu este foarte fezabilă și, odată cu dezvoltarea computerelor ieftine, există o cale mult mai ușoară. Iată o procedură simplă care este utilă în special dacă aveți numele clienților deja pe computer., Multe programe de calculator pot genera o serie de numere aleatorii. Să presupunem că puteți copia și lipi lista de nume de client într-o coloană dintr-o foaie de calcul EXCEL. Apoi, în coloana din dreapta de lângă ea inserați codul în funcția =RAND()
care este EXCEL modalitate de a pune un număr aleator între 0
și 1
în celule. Apoi, sortați ambele coloane – lista de nume și numărul aleatoriu-după numerele aleatorii. Aceasta rearanjează lista în ordine aleatorie de la cel mai mic la cel mai mare număr aleator., Apoi, tot ce trebuie să faceți este să luați primele sute de nume din această listă sortată. destul de simplu. Ai putea realiza, probabil, totul în mai puțin de un minut.eșantionarea simplă aleatorie este simplu de realizat și este ușor de explicat altora. Deoarece eșantionarea simplă aleatorie este o modalitate corectă de a selecta un eșantion, este rezonabil să generalizăm rezultatele din eșantion înapoi la populație. Eșantionarea simplă aleatorie nu este metoda cea mai eficientă din punct de vedere statistic și este posibil, doar din cauza norocului extragerii, să nu obțineți o bună reprezentare a subgrupurilor într-o populație., Pentru a rezolva aceste probleme, trebuie să apelăm la alte metode de eșantionare.
eșantionare aleatorie stratificată
eșantionarea aleatorie stratificată, uneori numită eșantionare aleatorie proporțională sau contingentară, implică împărțirea populației în subgrupuri omogene și apoi prelevarea unui eșantion aleatoriu simplu în fiecare subgrup. În termeni mai formali:
există mai multe motive majore pentru care ați putea prefera eșantionarea stratificată decât eșantionarea simplă aleatorie., În primul rând, vă asigură că veți putea reprezenta nu numai populația generală, ci și subgrupurile cheie ale populației, în special grupurile minoritare mici. Dacă doriți să puteți vorbi despre subgrupuri, aceasta poate fi singura modalitate de a vă asigura în mod eficient că veți putea. Dacă subgrupul este extrem de mic, puteți utiliza diferite fracții de eșantionare (f) în cadrul diferitelor straturi pentru a supra-proba aleatoriu grupul mic (deși va trebui apoi să cântăriți estimările din cadrul grupului folosind fracțiunea de eșantionare ori de câte ori doriți estimări globale ale populației)., Atunci când folosim aceeași fracție de eșantionare în cadrul straturilor, efectuăm eșantionare aleatorie stratificată proporțională. Când folosim diferite fracții de eșantionare în straturi, numim această eșantionare aleatorie stratificată disproporționată. În al doilea rând, eșantionarea aleatorie stratificată va avea, în general, mai multă precizie statistică decât eșantionarea aleatorie simplă. Acest lucru va fi valabil numai dacă straturile sau grupurile sunt omogene. Dacă sunt, ne așteptăm ca variabilitatea în cadrul grupurilor să fie mai mică decât variabilitatea pentru populație în ansamblu. Eșantionarea stratificată valorifică acest fapt.,de exemplu, să spunem că populația de clienți pentru agenția noastră poate fi împărțită în trei grupe: caucazian, afro-American și Hispanic-American. În plus, să presupunem că ambele Afro-Americani și Hispanici-Americani sunt relativ mici minorități de clientela (10%
și 5%
respectiv)., Dacă am făcut doar un simplu eșantion aleatoriu de n=100
cu o prelevare de probe fracțiune de 10%
, ne-am fi așteptat prin șansă în pace că ne-ar primi doar 10 si 5 persoane din fiecare dintre cele două grupuri mai mici. Și, din întâmplare, am putea obține mai puțin decât atât! Dacă stratificăm, putem face mai bine. În primul rând, să determinăm câți oameni vrem să avem în fiecare grup. Să presupunem că încă mai dorim să luăm un eșantion de 100 de la populația de 1000 de clienți în ultimul an. Dar credem că pentru a spune ceva despre subgrupuri vom avea nevoie de cel puțin 25 de cazuri în fiecare grup., Deci, să eșantionăm 50 de caucazieni, 25 de afro-americani și 25 de hispanici-americani. Știm că 10% din populație, sau 100 de clienți, sunt afro-americani. Dacă eșantionăm aleatoriu 25 dintre acestea, avem o fracție de eșantionare în interiorul stratului 25/100 = 25%
. În mod similar, știm că 5% sau 50 de clienți sunt hispanici-americani. Deci fracția noastră de eșantionare în strat va fi 25/50 = 50%
. În cele din urmă, prin scădere știm că există clienți caucazieni 850. Fracția noastră de eșantionare în interiorul stratului pentru ei este 50/850 = about 5.88%
., Deoarece grupurile sunt mai omogene în cadrul grupului decât în întreaga populație în ansamblu, ne putem aștepta la o precizie statistică mai mare (o variație mai mică). Și, pentru că am stratificat, știm că vom avea suficiente cazuri din fiecare grup pentru a face inferențe semnificative subgrup.,e sunt pașii pe care trebuie să urmați pentru a realiza o sistematică eșantion aleatoriu:
- numărul de unități din populația de
1
șiN
- decide cu privire la
n
(mărimea eșantionului) că vrei sau nevoie -
k = N/n
= intervalul de dimensiune - selectați aleatoriu un număr întreg între
1
șik
- apoi ia fiecare
kth
unitate
Toate acestea vor fi mult mai clare, cu un exemplu., Să presupunem că avem o populație care are doar n = 100 de persoane în ea și că doriți să luați un eșantion de n=20. Pentru a utiliza eșantionarea sistematică, populația trebuie listată într-o ordine aleatorie. Fracția de eșantionare ar fi f = 20/100 = 20%
. în acest caz, dimensiunea intervalului, k
, este egală cu N/n = 100/20 = 5
. Acum, selectați un număr întreg aleatoriu din 1 to 5
. În exemplul nostru, imaginați-vă că ați ales 4
., Acum, pentru a selecta eșantionul, începeți cu unitatea 4th
din listă și luați fiecare unitate k-th
(la fiecare 5, deoarece k=5). Ați fi eșantionat unitățile 4, 9, 14, 19 și așa mai departe la 100 și ați ajunge cu 20 de unități în eșantion.pentru ca acest lucru să funcționeze, este esențial ca unitățile din populație să fie ordonate aleatoriu, cel puțin în ceea ce privește caracteristicile pe care le măsurați. De ce ai vrea să folosești eșantionarea sistematică aleatorie? Pentru un singur lucru, este destul de ușor de făcut. Trebuie doar să selectați un singur număr aleatoriu pentru a începe lucrurile., De asemenea, poate fi mai precis decât simpla eșantionare aleatorie. În cele din urmă, în unele situații, pur și simplu nu există o modalitate mai ușoară de a face eșantionare aleatorie. De exemplu, odată a trebuit să fac un studiu care implica prelevarea de probe din toate cărțile dintr-o bibliotecă. Odată selectat, ar trebui să merg la raft, să localizez cartea și să înregistrez când a circulat ultima dată. Știam că am un cadru de eșantionare destul de bun sub forma listei de rafturi (care este un catalog de cărți în care intrările sunt aranjate în ordinea în care apar pe raft)., Pentru a face un eșantion aleatoriu simplu, aș fi putut estima numărul total de cărți și am generat numere aleatorii pentru a desena eșantionul; dar cum aș găsi cu ușurință cartea #74,329 dacă acesta este numărul pe care l-am selectat? Nu am putut conta foarte bine cărțile până când am ajuns la 74,329! Stratificarea nu ar rezolva nici această problemă. De exemplu, aș fi putut stratificat prin sertarul catalogului de carduri și am desenat un eșantion aleatoriu simplu în fiecare sertar. Dar tot aș fi rămas să număr Cărți. În schimb, am făcut o probă aleatorie sistematică. Am estimat numărul de cărți din întreaga colecție. Să ne imaginăm că a fost 100.000., Am decis că vreau să iau un eșantion de 1000 pentru o fracție de eșantionare de 1000/100,000 = 1%
. Pentru a obține intervalul de eșantionare k
, am împărțit N/n = 100,000/1000 = 100
. Apoi am selectat un număr întreg aleatoriu între 1
și 100
. Să presupunem că am 57
.apoi, am făcut un mic studiu lateral pentru a determina cât de groase sunt o mie de cărți în catalogul de carduri (ținând cont de vârstele diferite ale cărților)., Să zicem că, în medie, am constatat că două cărți care au fost separate prin 100
carduri au fost de aproximativ .75
inci în afară în catalog sertar. Această informație mi-a dat tot ce am nevoie pentru a trage proba. Am numărat până la 57 de mână și am înregistrat informațiile despre carte. Apoi, am luat o busolă. (Amintiți-vă cele de la clasa de matematică de liceu? Sunt instrumentele metalice amuzante, cu un ac ascuțit la un capăt și un creion pe celălalt, pe care le-ați folosit pentru a desena cercuri în clasa de geometrie.,) Apoi am pus busola de la .75"
, blocat pin-end la cea de a 57-card și a subliniat cu creion end la următoarea carte (aproximativ 100 de cărți). În acest fel, am aproximat selectarea 157, 257th, 357th, și așa mai departe. Am reușit să realizez întreaga procedură de selecție în foarte puțin timp folosind această abordare sistematică de eșantionare aleatorie. Probabil că aș mai fi acolo numărând Cărți dacă aș fi încercat o altă metodă de eșantionare aleatorie. (Bine, deci nu am viață. Am fost recompensat frumos, nu mă deranjează să spun, pentru a veni cu această schemă.,problema cu metodele de eșantionare aleatorie atunci când trebuie să eșantionăm o populație care este plătită într-o regiune geografică largă este că va trebui să acoperiți o mulțime de teren geografic pentru a ajunge la fiecare dintre unitățile pe care le-ați eșantionat. Imaginați-vă că luați un simplu eșantion aleatoriu al tuturor locuitorilor din statul New York pentru a efectua interviuri personale. Prin norocul tragerii, veți ajunge cu respondenții care vin din tot statul. Intervievatorii vor avea o mulțime de călătorie pentru a face., Tocmai pentru această problemă a fost inventată eșantionarea aleatorie a clusterului sau a zonei.
În cluster sampling, am urmați acești pași:
- împărți populația în grupuri (de obicei de-a lungul granițelor geografice)
- proba la întâmplare grupuri
- măsura tuturor unităților în eșantion grupuri
De exemplu, în figură se vedea o hartă a județelor din Statul New York. Să spunem că trebuie să facem un sondaj al guvernelor orașelor care ne va cere să mergem personal în orașe., Dacă facem un simplu eșantion aleatoriu la nivel de stat, va trebui să acoperim întregul stat geografic. În schimb, decidem să facem o eșantionare cluster din cinci județe (marcate cu roșu în figură). Odată ce acestea sunt selectate, vom merge la fiecare guvern oraș în cele cinci zone. În mod clar, această strategie ne va ajuta să economisim pe kilometrajul nostru. Eșantionarea clusterului sau a zonei este utilă în astfel de situații și se face în primul rând pentru eficiența administrării., Rețineți, de asemenea, că, probabil, nu trebuie să vă faceți griji cu privire la utilizarea acestei abordări dacă efectuăm un sondaj prin poștă sau telefon, deoarece nu contează la fel de mult (sau costă mai mult sau crește ineficiența) unde sunăm sau trimitem scrisori.cele patru metode pe care le – am acoperit până acum – simple, stratificate, sistematice și cluster-sunt cele mai simple strategii de eșantionare aleatoare. În majoritatea cercetărilor sociale aplicate reale, am folosi metode de eșantionare care sunt considerabil mai complexe decât aceste variații simple., Principiul cel mai important aici este că putem combina metodele simple descrise anterior într-o varietate de moduri utile care ne ajută să abordăm nevoile noastre de eșantionare în modul cel mai eficient și eficace posibil. Când combinăm metodele de eșantionare, numim această eșantionare în mai multe etape.
de exemplu, ia în considerare ideea de eșantionare a rezidenților din statul New York pentru interviuri față în față. În mod clar, am dori să facem un tip de eșantionare a clusterului ca primă etapă a procesului. S-ar putea să eșantionăm orașe sau tracturi de recensământ în tot statul., Dar în eșantionarea clusterelor am continua apoi să măsurăm pe toți cei din clusterele pe care le selectăm. Chiar dacă eșantionăm tracturile de recensământ, este posibil să nu putem măsura pe toți cei care se află în tractul de recensământ. Deci, am putea stabili un proces de eșantionare stratificat în cadrul clusterelor. În acest caz, am avea un proces de eșantionare în două etape, cu probe stratificate în probele de cluster. Sau, ia în considerare problema eșantionării elevilor în școlile de clasă. Am putea începe cu un eșantion național de districte școlare stratificate de Economie și nivel educațional., În districtele selectate, am putea face un simplu eșantion aleatoriu de școli. În cadrul școlilor, am putea face un simplu eșantion aleatoriu de clase sau clase. Și, în cadrul orelor, am putea face chiar și un simplu eșantion aleatoriu de studenți. În acest caz, avem trei sau patru etape în procesul de eșantionare și folosim eșantionare stratificată și simplă aleatorie. Prin combinarea diferitelor metode de eșantionare suntem capabili de a realiza o varietate bogată de metode probabilistice de eșantionare care pot fi utilizate într-o gamă largă de contexte de cercetare socială.