Zawartość
Kiedy wykonujesz eksperyment, który daje serię obserwowanych wartości, które chcesz porównać z wartościami teoretycznymi, odchylenie średniej kwadratowej (RMSD) lub błąd średniej kwadratowej (RMSE) pozwala skwantyfikować to porównanie. Oblicza się wartość RMSD przez znalezienie pierwiastka kwadratowego średniego błędu kwadratowego.
Formuła RMSD
W przypadku serii obserwacji oblicza się średni błąd kwadratowy, znajdując różnicę między każdą wartością eksperymentalną lub obserwowaną a wartością teoretyczną lub przewidywaną, podnosząc do kwadratu każdą różnicę, dodając je i dzieląc je przez liczbę zaobserwowanych wartości lub przewidywanych wartości .
To sprawia, że formuła RMSD:
{RMSD} = sqrt { frac { sum (x_e - x_o) ^ 2} {n}}dla xmi oczekiwane wartości, xo zaobserwowane wartości oraz n całkowita liczba wartości.
Ta metoda znajdowania różnicy (lub odchylenia), kwadratowania każdej różnicy, sumowania ich i dzielenia przez liczbę punktów danych (tak jak w przypadku znajdowania średniej zbioru danych), a następnie pierwiastek kwadratowy wyniku to co nadaje tej nazwie nazwę „odchylenie średniej kwadratowej”. Możesz zastosować takie podejście krok po kroku, aby obliczyć RMSD w programie Excel, co jest idealne dla dużych zestawów danych.
Odchylenie standardowe
Odchylenie standardowe mierzy, jak bardzo zestaw danych różni się w sobie. Możesz to obliczyć za pomocą (Σ (x - μ)2 / n)1/2 dla każdej wartości x dla n wartości z μ („mu”) średnia. Zauważ, że jest to ta sama formuła dla RMSD, ale zamiast oczekiwanych i obserwowanych wartości danych, używasz odpowiednio samej wartości danych i średniej zestawu danych. Korzystając z tego opisu, można porównać błąd pierwiastkowy kwadratowy z odchyleniem standardowym.
Oznacza to, że chociaż ma formułę o strukturze podobnej do RMSD, odchylenie standardowe mierzy określony hipotetyczny scenariusz eksperymentalny, w którym oczekiwane wartości stanowią średnią zbioru danych.
W tym hipotetycznym scenariuszu ilość wewnątrz pierwiastka kwadratowego (Σ (x - μ)2 / n) nazywa się zmienność, w jaki sposób dane są rozmieszczone wokół średniej. Określenie wariancji pozwala porównać zestaw danych z określonymi rozkładami, których można oczekiwać po danych na podstawie wcześniejszej wiedzy.
Co mówi RMSD
RMSD daje konkretny, ujednolicony sposób określania, w jaki sposób błędy w różnicach wartości przewidywanych różnią się od wartości obserwowanych dla eksperymentów. Im niższa wartość RMSD, tym dokładniejsze są wyniki eksperymentów z przewidywaniami teoretycznymi. Pozwalają one oszacować, w jaki sposób różne źródła błędów wpływają na obserwowane wyniki eksperymentów, takie jak opór powietrza wpływający na wahania wahadła lub napięcie powierzchniowe między płynem a jego pojemnikiem, uniemożliwiając mu przepływ.
Możesz ponadto upewnić się, że RMSD odzwierciedla zakres zestawu danych, dzieląc go przez różnicę między maksymalną obserwowaną wartością eksperymentalną a minimum w celu uzyskania znormalizowane odchylenie średniej kwadratowej lub błąd.
W dziedzinie dokowania molekularnego, w której badacze porównują teoretyczną generowaną komputerowo strukturę biomolekuł z tymi z wyników eksperymentalnych, RMSD może zmierzyć, jak ściśle wyniki eksperymentalne odzwierciedlają modele teoretyczne. Im więcej wyników eksperymentalnych jest w stanie odtworzyć to, co przewidują modele teoretyczne, tym niższy RMSD.
RMSD w praktycznych ustawieniach
Oprócz przykładu dokowania molekularnego meteorolodzy używają RMSD do określenia, jak ściśle matematyczne modele klimatu przewidują zjawiska atmosferyczne. Bioinformatycy, naukowcy badający biologię za pomocą środków komputerowych, określają, w jaki sposób odległości między pozycjami atomowymi cząsteczek białka zmieniają się od średniej odległości tych atomów w białkach, wykorzystując RMSD jako miarę dokładności.
Ekonomiści używają RMSD, aby dowiedzieć się, jak ściśle modele ekonomiczne pasują do mierzonych lub obserwowanych wyników działalności gospodarczej. Psychologowie używają RMSD do porównywania obserwowanych zachowań zjawisk psychologicznych lub psychologicznych z modelami obliczeniowymi.
Neuronaukowcy używają go do określania, w jaki sposób systemy sztuczne lub biologiczne mogą się uczyć w porównaniu do modeli uczenia się. Informatycy badający obrazowanie i widzenie porównują skuteczność, z jaką model może rekonstruować obrazy do oryginalnych obrazów różnymi metodami.