Zalety i wady modelu regresji wielokrotnej

Posted on
Autor: Laura McKinney
Data Utworzenia: 9 Kwiecień 2021
Data Aktualizacji: 17 Listopad 2024
Anonim
Tomasz Sochacki - Zalety i wady architektury mikro-frontendowej w dużej aplikacji [PL] [napisy]
Wideo: Tomasz Sochacki - Zalety i wady architektury mikro-frontendowej w dużej aplikacji [PL] [napisy]

Zawartość

Regresja wielokrotna służy do badania zależności między kilkoma zmiennymi niezależnymi a zmienną zależną. Podczas gdy modele regresji wielokrotnej pozwalają analizować względne wpływy tych niezależnych lub predykcyjnych zmiennych na zmienną zależną lub kryterium, te często złożone zestawy danych mogą prowadzić do fałszywych wniosków, jeśli nie zostaną odpowiednio przeanalizowane.

Przykłady regresji wielokrotnej

Agent nieruchomości mógłby wykorzystać regresję wielokrotną do analizy wartości domów. Na przykład mogłaby wykorzystać jako niezależne zmienne wielkość domów, ich wiek, liczbę sypialni, średnią cenę domu w sąsiedztwie i bliskość szkół. Rysując je w modelu regresji wielokrotnej, mogłaby następnie wykorzystać te czynniki, aby zobaczyć ich związek z cenami domów jako zmienną kryterium.

Innym przykładem zastosowania modelu regresji wielokrotnej może być ktoś w zasobach ludzkich określający wynagrodzenie na stanowiskach kierowniczych - zmienna kryterium. Zmiennymi predyktorami mogą być staż pracy każdego menedżera, średnia liczba przepracowanych godzin, liczba zarządzanych osób i budżet działu menedżerów.

Zalety regresji wielokrotnej

Istnieją dwie główne zalety analizy danych przy użyciu modelu regresji wielokrotnej. Pierwszą jest umiejętność określenia względnego wpływu jednej lub większej liczby zmiennych predykcyjnych na wartość kryterium. Agent nieruchomości może stwierdzić, że wielkość domów i liczba sypialni mają silną korelację z ceną domu, podczas gdy bliskość szkół w ogóle nie ma żadnej korelacji, a nawet ujemna, jeśli jest to przede wszystkim emerytura społeczność.

Drugą zaletą jest umiejętność rozpoznawania wartości odstających lub anomalii. Na przykład, przeglądając dane związane z wynagrodzeniami kierownictwa, kierownik działu kadr mógł stwierdzić, że liczba przepracowanych godzin, wielkość działu i jego budżet mają silną korelację z wynagrodzeniami, a staż pracy nie. Alternatywnie, może być tak, że wszystkie wymienione wartości predyktorów były skorelowane z każdym badanym wynagrodzeniem, z wyjątkiem jednego menedżera, który był przepłacany w porównaniu z innymi.

Wady regresji wielokrotnej

Wada stosowania modelu regresji wielokrotnej sprowadza się zwykle do wykorzystywanych danych. Dwa przykłady tego polegają na wykorzystaniu niepełnych danych i fałszywym wnioskowaniu, że korelacja jest przyczyną.

Na przykład, przeglądając cenę domów, załóżmy, że agent nieruchomości spojrzał tylko na 10 domów, z których siedem zostało zakupionych przez młodych rodziców. W takim przypadku związek między bliskością szkół może doprowadzić ją do przekonania, że ​​miało to wpływ na cenę sprzedaży wszystkich domów sprzedawanych w społeczności. To ilustruje pułapki niekompletnych danych. Gdyby zastosowała większą próbkę, mogłaby stwierdzić, że na 100 sprzedanych domów tylko dziesięć procent wartości domów było związanych z bliskością szkół. Gdyby wykorzystała wiek nabywców jako wartość prognostyczną, mogłaby odkryć, że młodsi kupujący byli skłonni zapłacić więcej za domy w społeczności niż starsi kupujący.

W przykładzie wynagrodzeń kadry kierowniczej załóżmy, że była jedna wartość odstająca, która miała mniejszy budżet, mniej stażu pracy i mniej personelu do zarządzania, ale zarabiała więcej niż ktokolwiek inny. Kierownik działu HR może spojrzeć na dane i stwierdzić, że ta osoba jest przepłacana. Wniosek ten byłby jednak błędny, gdyby nie wziął pod uwagę, że ten menedżer był odpowiedzialny za stronę internetową firmy i miał bardzo pożądane umiejętności w zakresie bezpieczeństwa sieci.