Jak obliczyć macierz korelacji

Posted on
Autor: John Stephens
Data Utworzenia: 25 Styczeń 2021
Data Aktualizacji: 19 Móc 2024
Anonim
How to Calculate a Correlation Matrix in Excel
Wideo: How to Calculate a Correlation Matrix in Excel

Zawartość

Korelacja (r) jest miarą liniowej zależności między dwiema zmiennymi. Na przykład długość nóg i długość tułowia są ściśle skorelowane; wzrost i waga są mniej silnie skorelowane, a wzrost i długość imienia (literami) są nieskorelowane.

Idealna korelacja dodatnia: r = 1. (Gdy jedna idzie w górę, druga idzie w górę) Idealna korelacja ujemna: r = -1 (Kiedy jedna idzie w górę, druga idzie w dół) Brak korelacji: r = 0 (Nie ma liniowej związek)

Macierz korelacji jest macierzą wielu korelacji.

Obliczanie macierzy korelacji z R.

    Uzyskaj dane. Jeśli dane są w programie Excel, najłatwiejszą metodą jest zapisanie ich jako pliku .csv (w programie Excel 7 kliknij „Plik”, a następnie „Zapisz jako”, a następnie „inne formaty”. Następnie w „Zapisz jako typ” przewiń w dół do CSV (wartości oddzielone przecinkami). Każdy wiersz powinien zawierać dane na jeden temat, a każda kolumna powinna być jedną zmienną.

    Wczytaj dane do R za pomocą read.csv. Na przykład, jeśli dane znajdują się w „c: mydisk mydir data.csv”, wpisz mydata <- read.csv („c: /mydisk/mydir/data.csv”).

    Oblicz macierz korelacji za pomocą cor (). Na przykład: cor (mydata). Możesz też zapisać macierz korelacji jako obiekt do późniejszego wykorzystania, używając: cormat <- cor (mydata).

Obliczanie macierzy korelacji za pomocą SAS

    Uzyskaj dane. SAS może odczytywać dane w wielu formatach. Jeśli przechowujesz dane w programie Excel, umieść jeden temat w każdym wierszu i jedną zmienną w każdej kolumnie

    Wczytaj dane do SAS. Możesz użyć kreatora IMPORT, aby uzyskać dane. Kliknij „Plik”, a następnie „Importuj dane”, a następnie wybierz typ danych za pomocą menu rozwijanego. Kliknij „Dalej” i przejdź do swoich danych, a następnie kliknij „Zakończ”.

    Oblicz macierz korelacji. Jeśli Twoje dane są zapisane w SAS jako moje dane ze zmiennymi VAR1, VAR2 i VAR3, wpisz: PROC CORR data = mydata; VAR var1 var2 var3; BIEGAĆ;

    Napiwki

    Ostrzeżenia