Zawartość
Wykres rozproszenia to wykres pokazujący związek między dwoma zestawami danych. Czasami pomocne jest wykorzystanie danych zawartych na wykresie rozrzutu w celu uzyskania matematycznej zależności między dwiema zmiennymi. Równanie wykresu punktowego można uzyskać ręcznie, stosując jeden z dwóch głównych sposobów: technikę graficzną lub technikę zwaną regresją liniową.
Tworzenie wykresu punktowego
Użyj papieru milimetrowego, aby utworzyć wykres rozproszenia. Narysuj osie xi y, upewnij się, że przecinają się i oznacz początek. Upewnij się, że osie x i y mają również prawidłowe tytuły. Następnie wykreśl każdy punkt danych na wykresie. Wszelkie trendy między drukowanymi zestawami danych powinny być teraz widoczne.
Linia najlepszego dopasowania
Po utworzeniu wykresu punktowego, zakładając, że istnieje korelacja liniowa między dwoma zestawami danych, możemy zastosować metodę graficzną w celu uzyskania równania. Weź linijkę i narysuj linię jak najbliżej wszystkich punktów. Spróbuj upewnić się, że jest tyle punktów powyżej linii, ile jest poniżej linii. Po narysowaniu linii użyj standardowych metod, aby znaleźć równanie linii prostej
Równanie linii prostej
Po umieszczeniu linii najlepszego dopasowania na wykresie rozrzutu łatwo jest znaleźć równanie. Ogólne równanie linii prostej jest następujące:
y = mx + c
Gdzie m jest nachyleniem (gradientem) linii, a c jest przecięciem y. Aby uzyskać gradient, znajdź dwa punkty na linii. Na potrzeby tego przykładu załóżmy, że dwa punkty to (1,3) i (0,1). Gradient można obliczyć, biorąc różnicę we współrzędnych y i dzieląc przez różnicę we współrzędnych x:
m = (3 - 1) / (1 - 0) = 2/1 = 2
Gradient w tym przypadku jest równy 2. Jak dotąd równanie linii prostej wynosi
y = 2x + c
Wartość c można uzyskać, zastępując wartości znanym punktem. Idąc za przykładem, jednym ze znanych punktów jest (1,3). Podłącz to do równania i zmień kolejność c:
3 = (2 * 1) + c
c = 3 - 2 = 1
Ostateczne równanie w tym przypadku to:
y = 2x + 1
Regresja liniowa
Regresja liniowa jest metodą matematyczną, której można użyć do uzyskania równania linii prostej wykresu rozrzutu. Zacznij od umieszczenia danych w tabeli. W tym przykładzie załóżmy, że mamy następujące dane:
(4.1, 2.2) (6.5, 4.5) (12.6, 10.4)
Obliczyć sumę wartości x:
x_sum = 4,1 + 6,5 + 12,6 = 23,2
Następnie obliczyć sumę wartości y:
y_sum = 2,2 + 4,4 + 10,4 = 17
Teraz zsumuj produkty każdego zestawu punktów danych:
xy_sum = (4,1 * 2,2) + (6,5 * 4,4) + (12,6 * 10,4) = 168,66
Następnie obliczyć sumę kwadratów wartości x i kwadratów wartości y:
x_square_sum = (4,1 ^ 2) + (6,5 ^ 2) + (12,6 ^ 2) = 217,82
y_square_sum = (2,2 ^ 2) + (4,5 ^ 2) + (10,4 ^ 2) = 133,25
Na koniec policz liczbę posiadanych punktów danych. W tym przypadku mamy trzy punkty danych (N = 3). Gradient dla najlepiej dopasowanej linii można uzyskać z:
m = (N * xy_sum) - (x_sum * y_sum) / (N * x_square_sum) - (x_sum * x_sum) = (3 * 168,66) - (23,2 * 17) / (3 * 217,82) - (23,2 * 23,2) = 0,968
Punkt przecięcia dla linii najlepiej dopasowanej można uzyskać z:
c = (x_square_sum * y_sum) - (x_sum * xy_sum) / (N * x_square_sum) - (x_sum * x_sum)
= (217.82 17) - (23.2 168.66) / (3 * 217.82) - (23.2 * 23.2) = -1.82
Ostateczne równanie jest zatem:
y = 0,968x - 1,82