Jak obliczyć zakres międzykwartylowy

Posted on
Autor: Monica Porter
Data Utworzenia: 22 Marsz 2021
Data Aktualizacji: 19 Listopad 2024
Anonim
Kwartyle - definicja, przykłady, wyjaśnienie
Wideo: Kwartyle - definicja, przykłady, wyjaśnienie

Zawartość

Zakres międzykwartylowy, często skracany jako IQR, reprezentuje zakres od 25. percentyla do 75. percentyla, lub środkowe 50%, dowolnego zestawu danych. Przedział międzykwartylowy może być użyty do ustalenia, jaki byłby średni zakres wydajności testu: możesz go użyć, aby sprawdzić, gdzie spada większość ludzi w danym teście, lub określić, ile pieniędzy przeciętny pracownik w firmie zarabia każdego miesiąca . Zakres międzykwartylowy może być bardziej skutecznym narzędziem analizy danych niż średnia lub mediana zbioru danych, ponieważ pozwala zidentyfikować zakres rozproszenia, a nie tylko pojedynczą liczbę.

TL; DR (Too Long; Didnt Read)

Zakres międzykwartylowy (IQR) reprezentuje środkowe 50 procent zbioru danych. Aby to obliczyć, najpierw uporządkuj punkty danych od najmniejszej do największej, a następnie określ pozycje pierwszego i trzeciego kwartylu za pomocą odpowiednio wzorów (N + 1) / 4 i 3 * (N + 1) / 4, gdzie N jest liczbą punktów w zbiorze danych. Na koniec odejmij pierwszy kwartyl od trzeciego kwartylu, aby określić zakres międzykwartylowy dla zestawu danych.

Zamów punkty danych

Obliczanie zasięgu międzykwartylowego jest prostym zadaniem, ale przed obliczeniem konieczne będzie ustawienie różnych punktów zbioru danych. Aby to zrobić, zacznij od zamówienia punktów danych od najmniejszej do największej. Na przykład jeśli Twoje punkty danych to 10, 19, 8, 4, 9, 12, 15, 11 i 20, możesz zmienić ich kolejność w następujący sposób: {4, 8, 9, 10, 11, 12, 15, 19, 20}. Po zamówieniu punktów danych w ten sposób możesz przejść do następnego kroku.

Określ pozycję pierwszego kwartylu

Następnie określ pozycję pierwszego kwartylu za pomocą następującego wzoru: (N + 1) / 4, gdzie N jest liczbą punktów w zbiorze danych. Jeśli pierwszy kwartyl mieści się między dwiema liczbami, weź średnią z dwóch liczb jako swój pierwszy kwartyl. W powyższym przykładzie, ponieważ istnieje dziewięć punktów danych, należy dodać 1 do 9, aby uzyskać 10, a następnie podzielić przez 4, aby uzyskać 2,5. Ponieważ pierwszy kwartyl mieści się między drugą a trzecią wartością, wziąłbyś średnio 8 i 9, aby uzyskać pozycję pierwszego kwartylu 8,5.

Określ pozycję trzeciego kwartylu

Po określeniu pierwszego kwartylu określ pozycję trzeciego kwartylu za pomocą następującego wzoru: 3 * (N + 1) / 4, gdzie N jest ponownie liczbą punktów w zbiorze danych. Podobnie, jeśli trzeci kwartyl mieści się między dwiema liczbami, po prostu weź średnią, tak jak zrobiłbyś to, obliczając wynik pierwszego kwartylu. W powyższym przykładzie, ponieważ istnieje dziewięć punktów danych, należy dodać 1 do 9, aby uzyskać 10, pomnożyć przez 3, aby uzyskać 30, a następnie podzielić przez 4, aby uzyskać 7,5. Ponieważ pierwszy kwartyl mieści się między siódmą a ósmą wartością, wziąłbyś średnio 15 i 19, aby uzyskać wynik trzeciego kwartylu wynoszący 17.

Oblicz zakres międzykwartylowy

Po określeniu pierwszego i trzeciego kwartylu oblicz zakres międzykwartylowy, odejmując wartość pierwszego kwartylu od wartości trzeciego kwartylu. Aby zakończyć przykład użyty w tym artykule, odejmij 8,5 od 17, aby stwierdzić, że zakres międzykwartylowy zestawu danych wynosi 8,5.

Zalety i wady IQR

Zakres międzykwartylowy ma tę zaletę, że jest w stanie zidentyfikować i wyeliminować wartości odstające na obu końcach zestawu danych. IQR jest również dobrym miernikiem zmienności w przypadku przekrzywionego rozkładu danych, a ta metoda obliczania IQR może działać dla zgrupowanych zestawów danych, o ile do uporządkowania punktów danych używa się skumulowanego rozkładu częstotliwości. Formuła zakresu międzykwartylowego dla danych zgrupowanych jest taka sama, jak w przypadku danych niepogrupowanych, przy czym IQR jest równy wartości pierwszego kwartylu odjętej od wartości trzeciego kwartylu. Ma jednak kilka wad w porównaniu do odchylenia standardowego: mniejszą wrażliwość na kilka skrajnych wyników i stabilność próbkowania, która nie jest tak silna jak odchylenie standardowe.