Zawartość
- Obliczanie średniej
- Obliczanie mediany
- Tryb obliczania
- Obliczanie zakresu
- Obliczanie odchylenia standardowego
Uprość porównania zestawów liczb, szczególnie dużych zestawów liczb, obliczając wartości środkowe za pomocą średniej, trybu i mediany. Użyj zakresów i standardowych odchyleń zbiorów, aby zbadać zmienność danych.
Obliczanie średniej
Średnia określa średnią wartość zestawu liczb. Weźmy na przykład zestaw danych zawierający wartości 20, 24, 25, 36, 25, 22, 23.
Aby znaleźć średnią, użyj wzoru: Średnia jest równa sumie liczb w zestawie danych podzielonej przez liczbę wartości w zestawie danych. W kategoriach matematycznych: średnia = (suma wszystkich terminów) ÷ (ile terminów lub wartości w zbiorze).
Dodaj liczby do przykładowego zestawu danych: 20 + 24 + 25 + 36 + 25 + 22 + 23 = 175.
Podziel przez liczbę punktów danych w zestawie. Ten zestaw ma siedem wartości, więc podziel przez 7.
Wstaw wartości do wzoru, aby obliczyć średnią. Średnia jest równa sumie wartości (175) podzielonej przez liczbę punktów danych (7). Ponieważ 175 ÷ 7 = 25, średnia tego zestawu danych wynosi 25. Nie wszystkie wartości średnie będą równe liczbie całkowitej.
Obliczanie mediany
Mediana identyfikuje punkt środkowy lub środkową wartość zestawu liczb.
Uporządkuj liczby od najmniejszej do największej. Skorzystaj z przykładowego zestawu wartości: 20, 24, 25, 36, 25, 22, 23. Po uporządkowaniu, zestaw będzie wyglądał następująco: 20, 22, 23, 24, 25, 25, 36.
Ponieważ ten zestaw liczb ma siedem wartości, mediana lub wartość w środku wynosi 24.
Jeśli zbiór liczb ma parzystą liczbę wartości, oblicz średnią dwóch wartości środkowych. Załóżmy na przykład, że zestaw liczb zawiera wartości 22, 23, 25, 26. Środek leży między 23 a 25. Dodanie 23 i 25 daje 48. Dzielenie 48 przez dwa daje medianę 24.
Tryb obliczania
Tryb identyfikuje najczęstszą wartość lub wartości w zestawie danych. W zależności od danych może istnieć jeden lub więcej trybów lub w ogóle nie być tryb.
Podobnie jak znalezienie mediany, uporządkuj zestaw danych od najmniejszej do największej. W zestawie przykładów uporządkowane wartości to: 20, 22, 23, 24, 25, 25, 36.
Tryb pojawia się, gdy wartości się powtarzają. W zestawie przykładów wartość 25 występuje dwukrotnie. Żadne inne liczby się nie powtarzają. Dlatego tryb ma wartość 25.
W niektórych zestawach danych występuje więcej niż jeden tryb. Zestaw danych 22, 23, 23, 24, 27, 27, 29 zawiera dwa tryby, każdy w 23 i 27. Inne zestawy danych mogą mieć więcej niż dwa tryby, mogą mieć tryby o więcej niż dwóch liczbach (jak 23, 23 , 24, 24, 24, 28, 29: tryb jest równy 24) lub może nie mieć żadnych trybów (jak 21, 23, 24, 25, 26, 27, 29). Tryb może wystąpić w dowolnym miejscu w zbiorze danych, nie tylko w środku.
Obliczanie zakresu
Zakres pokazuje matematyczną odległość między najniższą a najwyższą wartością w zbiorze danych. Zakres mierzy zmienność zestawu danych. Szeroki zakres wskazuje na większą zmienność danych lub być może jedną wartość odstającą daleko od reszty danych. Wartości odstające mogą przechylać lub przesuwać średnią wartość na tyle, aby wpłynąć na analizę danych.
W grupie próbek najniższa wartość wynosi 20, a najwyższa 36.
Aby obliczyć zakres, odejmij najniższą wartość od najwyższej wartości. Ponieważ 36-20 = 16, zakres wynosi 16.
W zestawie próbek wysoka wartość danych 36 przekracza poprzednią wartość, 25, o 11. Ta wartość wydaje się ekstremalna, biorąc pod uwagę inne wartości w zestawie. Wartość 36 może być punktem danych odstającym.
Obliczanie odchylenia standardowego
Odchylenie standardowe mierzy zmienność zestawu danych. Podobnie jak zakres, mniejsze odchylenie standardowe wskazuje na mniejszą zmienność.
Znalezienie odchylenia standardowego wymaga zsumowania kwadratowej różnicy między każdym punktem danych a średnią, dodania wszystkich kwadratów, podzielenia tej sumy o jedną liczbę mniejszą niż liczba wartości (N-1), a na koniec obliczenia pierwiastka kwadratowego dywidendy. Matematycznie zacznij od obliczenia średniej.
Oblicz średnią, dodając wszystkie wartości punktów danych, a następnie dzieląc przez liczbę punktów danych. W przykładowym zbiorze danych 20 + 24 + 25 + 36 + 25 + 22 + 23 = 175. Podziel sumę 175 przez liczbę punktów danych 7 lub 175 ÷ 7 = 25. Średnia wynosi 25.
Następnie odejmij średnią z każdego punktu danych, a następnie wyrównaj każdą różnicę. Wzór wygląda następująco: ∑ (x-µ)2, gdzie ∑ oznacza sumę, x oznacza każdą wartość zestawu danych, a µ oznacza wartość średnią. Kontynuując zestaw przykładów, wartości stają się: 20-25 = -5 i -52= 25; 24-25 = -1 i -12= 1; 25–25 = 0 i 02= 0; 36–25 = 11 i 112= 121; 25–25 = 0 i 02= 0; 22-25 = -3 i -32= 9; oraz 23-25 = -2 i -22=4.
Dodanie różnic kwadratowych daje: 25 + 1 + 0 + 121 + 0 + 9 + 4 = 160.
Podziel sumę kwadratów różnic przez jeden mniej niż liczbę punktów danych. Przykładowy zestaw danych ma 7 wartości, więc N-1 wynosi 7-1 = 6. Suma różnic kwadratowych, 160, podzielona przez 6, wynosi około 26,6667.
Oblicz odchylenie standardowe, znajdując pierwiastek kwadratowy z podziału przez N-1. W tym przykładzie pierwiastek kwadratowy z 26,6667 jest równy około 5,164. Dlatego odchylenie standardowe wynosi około 5,164.
Odchylenie standardowe pomaga ocenić dane. Liczby w zestawie danych, które mieszczą się w jednym standardowym odchyleniu średniej, są częścią zestawu danych. Liczby, które nie mieszczą się w dwóch standardowych odchyleniach, są wartościami ekstremalnymi lub wartościami odstającymi. W zestawie przykładów wartość 36 leży w więcej niż dwóch standardowych odchyleniach od średniej, więc 36 jest wartością odstającą. Wartości odstające mogą przedstawiać błędne dane lub mogą sugerować nieprzewidziane okoliczności i należy je starannie rozważyć podczas interpretacji danych.