Zawartość
Kiedy naukowcy, ekonomiści lub statystycy dokonują prognoz na podstawie teorii, a następnie gromadzą rzeczywiste dane, potrzebują sposobu na zmierzenie różnic między przewidywanymi a zmierzonymi wartościami. Zazwyczaj polegają one na średnim błędzie kwadratowym (MSE), który jest sumą wariantów poszczególnych punktów danych podniesionych do kwadratu i podzielonych przez liczbę punktów danych pomniejszoną o 2. Gdy dane są wyświetlane na wykresie, MSE określa się na podstawie sumując zmiany w punktach danych osi pionowej. Na wykresie x-y byłyby to wartości y.
Dlaczego kwadratowe wariacje?
Pomnożenie zmienności między przewidywanymi a obserwowanymi wartościami ma dwa pożądane skutki. Pierwszym jest upewnienie się, że wszystkie wartości są dodatnie. Jeśli jedna lub więcej wartości były ujemne, suma wszystkich wartości mogłaby być nierealnie mała i słaba reprezentacja faktycznej zmienności między wartościami przewidywanymi i obserwowanymi. Drugą zaletą kwadratu jest nadanie większej wagi większym różnicom, co zapewnia, że duża wartość MSE oznacza duże zróżnicowanie danych.
Przykładowy algorytm obliczania zapasów
Załóżmy, że masz algorytm, który codziennie prognozuje ceny danego towaru. W poniedziałek przewiduje się, że cena akcji wyniesie 5,50 USD, we wtorek 6,00 USD, środa 6,00 USD, czwartek 7,50 USD i piątek 8,00 USD. Biorąc pod uwagę poniedziałek jako Dzień 1, masz zestaw punktów danych, które wyglądają następująco: (1, 5,50), (2, 6,00), (3, 6,00), (4, 7,50) i (5, 8,00). Rzeczywiste ceny są następujące: poniedziałek 4,75 USD (1, 4,75); Wtorek 5,35 USD (2, 5,35); Środa 6,25 USD (3, 6,25); Czwartek 7,25 USD (4, 7,25); i piątek: 8,50 USD (5, 8,50).
Różnice między wartościami y tych punktów wynoszą odpowiednio 0,75, 0,65, -0,25, 0,25 i -0,50, gdzie znak ujemny wskazuje przewidywaną wartość mniejszą niż obserwowana. Aby obliczyć MSE, najpierw kwadrat każdej wartości zmiany, co eliminuje znaki minus i daje 0,5625, 0,4225, 0,0625, 0,0625 i 0,25. Zsumowanie tych wartości daje 1,36 i podzielenie przez liczbę pomiarów minus 2, czyli 3, daje MSE, który okazuje się wynosić 0,45.
MSE i RMSE
Mniejsze wartości dla MSE wskazują na ściślejszą zgodność między przewidywanymi i obserwowanymi wynikami, a MSE wynosząca 0,0 oznacza doskonałą zgodność. Należy jednak pamiętać, że wartości zmienności są podniesione do kwadratu. Gdy wymagany jest pomiar błędu, który jest w tych samych jednostkach co punkty danych, statystycy przyjmują błąd średniej kwadratowej (RMSE). Osiągają to, biorąc pierwiastek kwadratowy średniego błędu kwadratu. W powyższym przykładzie RSME wynosiłby 0,671 lub około 67 centów.