Zawartość
- TL; DR (Too Long; Didnt Read)
- Definicja wielkości próbki
- Obliczanie wielkości próbki
- Zagrożenia wynikające z małej wielkości próbki
- Rozmiar próbki i margines błędu
Wielkość próby to liczba poszczególnych próbek lub obserwacji w dowolnym układzie statystycznym, takim jak eksperyment naukowy lub badanie opinii publicznej. Chociaż stosunkowo prosta koncepcja, wybór wielkości próby jest kluczowym czynnikiem determinującym projekt. Zbyt mała próbka daje niewiarygodne wyniki, podczas gdy zbyt duża próbka wymaga dużo czasu i zasobów.
TL; DR (Too Long; Didnt Read)
Wielkość próbki jest bezpośrednim zliczeniem liczby zmierzonych próbek lub dokonywanych obserwacji.
Definicja wielkości próbki
Wielkość próby mierzy liczbę pojedynczych zmierzonych próbek lub obserwacji wykorzystanych w ankiecie lub eksperymencie. Na przykład, jeśli testujesz 100 próbek gleby pod kątem śladów kwaśnego deszczu, twoja próbka wynosi 100. Jeśli ankieta online zwróciła 30 500 wypełnionych kwestionariuszy, twoja próbka wynosi 30 500. W statystykach wielkość próbki jest ogólnie reprezentowana przez zmienną „n”.
Obliczanie wielkości próbki
Aby określić wielkość próby potrzebną do eksperymentu lub ankiety, naukowcy biorą pod uwagę szereg pożądanych czynników. Pierwszy, łączna wielkość badanej populacji należy wziąć pod uwagę - na przykład badanie, które ma na celu wyciągnięcie wniosków na temat całego stanu Nowy Jork, będzie wymagało znacznie większej próby niż ta, która dotyczy konkretnie Rochester. Naukowcy będą również musieli rozważyć margines błędu, wiarygodność, że gromadzone dane są zasadniczo dokładne; i poziom zaufania, prawdopodobieństwo, że margines błędu jest dokładny. Wreszcie naukowcy muszą wziąć pod uwagę odchylenie standardowe spodziewają się zobaczyć w danych. Odchylenie standardowe mierzy, jak bardzo poszczególne fragmenty danych różnią się od średnich zmierzonych danych. Na przykład próbki gleby z jednego parku prawdopodobnie będą miały znacznie mniejsze standardowe odchylenie w zawartości azotu niż gleby zebrane z całego hrabstwa.
Zagrożenia wynikające z małej wielkości próbki
Duże statystyki są potrzebne, aby statystyki były dokładne i wiarygodne, zwłaszcza jeśli ich wyniki mają być ekstrapolowane na większą populację lub grupę danych. Załóżmy, że przeprowadzałeś ankietę na temat ćwiczeń i przeprowadziłeś wywiad z pięcioma osobami, z których dwie stwierdziły, że co roku biegają maraton. Jeśli weźmiesz tę ankietę, aby reprezentować populację kraju jako całości, to według twoich badań 40 procent ludzi biega co najmniej jeden maraton rocznie - nieoczekiwanie wysoki odsetek. Im mniejszy rozmiar próbki, tym bardziej prawdopodobne wartości odstające - nietypowe dane - mają wypaczyć twoje ustalenia.
Rozmiar próbki i margines błędu
Wielkość próby badania statystycznego jest również bezpośrednio związana z marginesem błędu w badaniach. Margines błędu wynosi odsetek, który wyraża prawdopodobieństwo, że otrzymane dane są dokładne. Na przykład w ankiecie dotyczącej przekonań religijnych margines błędu to odsetek respondentów, u których można oczekiwać takiej samej odpowiedzi, jeśli ankieta zostanie powtórzona. Aby ustalić margines błędu, podziel 1 przez pierwiastek kwadratowy z wielkości próbki, a następnie pomnóż przez 100, aby uzyskać wartość procentową. Na przykład próbka o wielkości 2400 będzie miała margines błędu 2,04 procent.