Jak obliczyć MSE

Posted on
Autor: Lewis Jackson
Data Utworzenia: 14 Móc 2021
Data Aktualizacji: 17 Listopad 2024
Anonim
Machine Learning with Python! Mean Squared Error (MSE)
Wideo: Machine Learning with Python! Mean Squared Error (MSE)

Zawartość

Kiedy naukowcy, ekonomiści lub statystycy dokonują prognoz na podstawie teorii, a następnie gromadzą rzeczywiste dane, potrzebują sposobu na zmierzenie różnic między przewidywanymi a zmierzonymi wartościami. Zazwyczaj polegają one na średnim błędzie kwadratowym (MSE), który jest sumą wariantów poszczególnych punktów danych podniesionych do kwadratu i podzielonych przez liczbę punktów danych pomniejszoną o 2. Gdy dane są wyświetlane na wykresie, MSE określa się na podstawie sumując zmiany w punktach danych osi pionowej. Na wykresie x-y byłyby to wartości y.

Dlaczego kwadratowe wariacje?

Pomnożenie zmienności między przewidywanymi a obserwowanymi wartościami ma dwa pożądane skutki. Pierwszym jest upewnienie się, że wszystkie wartości są dodatnie. Jeśli jedna lub więcej wartości były ujemne, suma wszystkich wartości mogłaby być nierealnie mała i słaba reprezentacja faktycznej zmienności między wartościami przewidywanymi i obserwowanymi. Drugą zaletą kwadratu jest nadanie większej wagi większym różnicom, co zapewnia, że ​​duża wartość MSE oznacza duże zróżnicowanie danych.

Przykładowy algorytm obliczania zapasów

Załóżmy, że masz algorytm, który codziennie prognozuje ceny danego towaru. W poniedziałek przewiduje się, że cena akcji wyniesie 5,50 USD, we wtorek 6,00 USD, środa 6,00 USD, czwartek 7,50 USD i piątek 8,00 USD. Biorąc pod uwagę poniedziałek jako Dzień 1, masz zestaw punktów danych, które wyglądają następująco: (1, 5,50), (2, 6,00), (3, 6,00), (4, 7,50) i (5, 8,00). Rzeczywiste ceny są następujące: poniedziałek 4,75 USD (1, 4,75); Wtorek 5,35 USD (2, 5,35); Środa 6,25 USD (3, 6,25); Czwartek 7,25 USD (4, 7,25); i piątek: 8,50 USD (5, 8,50).

Różnice między wartościami y tych punktów wynoszą odpowiednio 0,75, 0,65, -0,25, 0,25 i -0,50, gdzie znak ujemny wskazuje przewidywaną wartość mniejszą niż obserwowana. Aby obliczyć MSE, najpierw kwadrat każdej wartości zmiany, co eliminuje znaki minus i daje 0,5625, 0,4225, 0,0625, 0,0625 i 0,25. Zsumowanie tych wartości daje 1,36 i podzielenie przez liczbę pomiarów minus 2, czyli 3, daje MSE, który okazuje się wynosić 0,45.

MSE i RMSE

Mniejsze wartości dla MSE wskazują na ściślejszą zgodność między przewidywanymi i obserwowanymi wynikami, a MSE wynosząca 0,0 oznacza doskonałą zgodność. Należy jednak pamiętać, że wartości zmienności są podniesione do kwadratu. Gdy wymagany jest pomiar błędu, który jest w tych samych jednostkach co punkty danych, statystycy przyjmują błąd średniej kwadratowej (RMSE). Osiągają to, biorąc pierwiastek kwadratowy średniego błędu kwadratu. W powyższym przykładzie RSME wynosiłby 0,671 lub około 67 centów.