Zawartość
- Rodzaj wymaganych danych
- Test dobroci dopasowania
- Obliczanie statystyki chi-kwadrat
- Interpretacja statystyki chi-kwadrat
Prognozy dotyczące eksperymentów. Prognozy te są często numeryczne, co oznacza, że kiedy naukowcy zbierają dane, oczekują, że liczby te się rozpadną w określony sposób. Rzeczywiste dane rzadko odpowiadają dokładnie prognozom, jakie poczynią naukowcy, dlatego naukowcy potrzebują testu, aby stwierdzić, czy różnica między obserwowanymi a oczekiwanymi liczbami wynika z przypadkowej szansy, czy z jakiegoś nieprzewidzianego czynnika, który zmusi naukowca do dostosowania podstawowej teorii . Test chi-kwadrat jest narzędziem statystycznym, którego naukowcy używają do tego celu.
Rodzaj wymaganych danych
Potrzebujesz danych kategorycznych, aby zastosować test chi-kwadrat. Przykładem danych kategorycznych jest liczba osób, które odpowiedziały na pytanie „tak” w porównaniu z liczbą osób, które odpowiedziały na pytanie „nie” (dwie kategorie) lub liczba żab w populacji, które są zielone, żółte lub szare ( trzy kategorie). Nie można używać testu chi-kwadrat na ciągłych danych, takich jak dane zebrane w ankiecie z pytaniem ludzi, ile mają wzrostu. Z takiej ankiety uzyskasz szeroki zakres wysokości. Jeśli jednak podzielisz wysokości na kategorie, takie jak „poniżej 6 stóp wysokości” i „6 stóp wysokości i więcej”, możesz użyć testu chi-kwadrat na danych.
Test dobroci dopasowania
Test dobroci dopasowania jest powszechnym i być może najprostszym testem przeprowadzanym przy użyciu statystyki chi-kwadrat. W teście dobroci dopasowania naukowiec dokonuje konkretnej prognozy liczb, których spodziewa się zobaczyć w każdej kategorii swoich danych. Następnie zbiera rzeczywiste dane - zwane danymi obserwowanymi - i używa testu chi-kwadrat, aby sprawdzić, czy zaobserwowane dane odpowiadają jej oczekiwaniom.
Wyobraź sobie na przykład, że biolog studiuje wzorce dziedziczenia u gatunku żaby. Spośród 100 potomstwa rodziców żab, model genetyczny biologów prowadzi ją do spodziewania się 25 żółtych potomstwa, 50 zielonych i 25 szarych. To, co faktycznie obserwuje, to 20 żółtych potomstwa, 52 zielone i 28 szare. Czy jej prognoza jest obsługiwana, czy też jej model genetyczny jest niepoprawny? Aby to sprawdzić, może użyć testu chi-kwadrat.
Obliczanie statystyki chi-kwadrat
Rozpocznij obliczanie statystyki chi-kwadrat odejmując każdą oczekiwaną wartość od odpowiadającej jej wartości obserwowanej i podnosząc do kwadratu każdy wynik. Obliczenia dla przykładu potomstwa żaby wyglądałyby następująco:
żółty = (20-25) ^ 2 = 25 zielony = (52-50) ^ 2 = 4 szary = (28-25) ^ 2 = 9
Teraz podziel każdy wynik przez odpowiadającą mu wartość oczekiwaną.
żółty = 25 ÷ 25 = 1 zielony = 4 ÷ 50 = 0,08 szary = 9 ÷ 25 = 0,36
Na koniec dodaj odpowiedzi z poprzedniego kroku.
chi-kwadrat = 1 + 0,08 + 0,36 = 1,44
Interpretacja statystyki chi-kwadrat
Statystyka chi-kwadrat pokazuje, jak różne były twoje zaobserwowane wartości od przewidywanych wartości. Im wyższa liczba, tym większa różnica. Możesz ustalić, czy wartość chi-kwadrat jest zbyt wysoka, czy wystarczająco niska, aby poprzeć swoje przewidywanie, sprawdzając, czy jest poniżej pewnego Krytyczna wartość na stole rozdzielczym chi-kwadrat. Ta tabela dopasowuje wartości chi-kwadrat z prawdopodobieństwami, tzw wartości p. W szczególności tabela pokazuje prawdopodobieństwo, że różnice między zaobserwowanymi a oczekiwanymi wartościami wynikają z przypadkowej szansy lub z obecności innego czynnika. W przypadku testu dobroci dopasowania, jeśli wartość p wynosi 0,05 lub mniej, musisz odrzucić swoją prognozę.
Musisz określić stopnie swobody (df) w danych, zanim będzie można sprawdzić krytyczną wartość chi-kwadrat w tabeli rozkładu. Stopnie swobody oblicza się, odejmując 1 od liczby kategorii w danych. W tym przykładzie są trzy kategorie, więc są 2 stopnie swobody. Rzut oka na tę tabelę rozkładu chi-kwadrat pokazuje, że dla 2 stopni swobody wartość krytyczna dla prawdopodobieństwa 0,05 wynosi 5,99. Oznacza to, że tak długo, jak obliczona wartość chi-kwadrat jest mniejsza niż 5,99, oczekiwane wartości, a tym samym leżąca u podstaw teoria, są prawidłowe i obsługiwane. Ponieważ statystyka chi-kwadrat dla danych potomstwa żaby wynosiła 1,44, biolog może zaakceptować jej model genetyczny.