multipel regressionsanalyse ved hjælp af SPSS-statistik

posted in: Articles | 0

introduktion

multipel regression er en udvidelse af simpel lineær regression. Det bruges, når vi vil forudsige værdien af en variabel baseret på værdien af to eller flere andre variabler. Den variabel, vi vil forudsige, kaldes den afhængige variabel (eller undertiden resultatet, mål-eller kriterievariablen)., De variabler, vi bruger til at forudsige værdien af den afhængige variabel, kaldes den uafhængige variabler (eller nogle gange, prædiktor, forklarende eller regressor variabler).bruge flere regression til at forstå, om eksamensydelse kan forudsiges baseret på revisionstid, testangst, forelæsningsdeltagelse og køn. Alternativt kan du bruge flere regression til at forstå, om det daglige cigaretforbrug kan forudsiges baseret på rygningsvarighed, alder, når man begyndte at ryge, rygertype, indkomst og køn.,

Multiple regression giver dig også mulighed for at bestemme den samlede pasform (varians forklaret) af modellen og det relative bidrag fra hver af forudsigelserne til den samlede varians forklaret. For eksempel vil du måske vide, hvor meget af variationen i eksamensydelse kan forklares ved revisionstid, testangst, forelæsningsdeltagelse og køn “som helhed”, men også det “relative bidrag” af hver uafhængig variabel til forklaring af variansen.,

denne “quickuick start” – guide viser dig, hvordan du udfører flere regression ved hjælp af SPSS-statistikker, samt fortolker og rapporterer resultaterne fra denne test. Men før vi introducerer dig til denne procedure, skal du forstå de forskellige antagelser, som dine data skal opfylde for at flere regression giver dig et gyldigt resultat. Vi diskuterer disse antagelser næste.,

SPSS Statistik

Antagelser

Når du vælger at analysere dine data ved hjælp af multipel regression, en del af processen indebærer kontrol for at sikre, at de data, du ønsker at analysere, kan faktisk blive analyseret ved hjælp af multipel regression. Du skal gøre dette, fordi det kun er hensigtsmæssigt at bruge flere regression, hvis dine data “passerer” otte antagelser, der kræves for flere regression for at give dig et gyldigt resultat., I praksis, kontrol for disse otte antagelser tilføjer blot en lille smule mere tid til din analyse, der kræver, at du til at klikke på et par knapper i SPSS Statistics, når du udfører din analyse, samt tænke lidt mere over dine data, men det er ikke en vanskelig opgave.

før vi introducerer dig til disse otte antagelser, skal du ikke blive overrasket, hvis du analyserer dine egne data ved hjælp af SPSS-statistikker, en eller flere af disse antagelser overtrædes (dvs.ikke opfyldt)., Dette er ikke ualmindeligt, når du arbejder med data i den virkelige verden snarere end lærebogeksempler, som ofte kun viser dig, hvordan du udfører flere regression, når alt går godt! Men rolig. Selv når dine data fejler visse antagelser, er der ofte en løsning til at overvinde dette. Lad os først se på disse otte antagelser:

  • antagelse #1: Din afhængige variabel skal måles på en kontinuerlig skala (dvs.det er enten en interval-eller ratio-variabel)., Eksempler på variabler, som opfylder dette kriterium omfatter revision tiden (målt i timer), intelligens (målt ved hjælp af IQ-score), eksamen, præstationer (målt fra 0 til 100), vægt (målt i kg), og så videre. Du kan lære mere om interval-og forholdsvariabler i vores artikel: Variabeltyper. Hvis din afhængige variabel blev målt på en ordinær skala, skal du udføre ordinal regression snarere end flere regression. Eksempler på ordinære variabler omfatter Likert-elementer (f. eks.,, en 7-punkts skala fra” stærkt enig “til” stærkt uenig”), blandt andre måder at rangordne kategorier (f.eks. en 3-punkts skala, der forklarer, hvor meget en kunde kunne lide et produkt, lige fra” ikke meget “til”ja, meget”).2: du har to eller flere uafhængige variabler, som kan være enten kontinuerlige (dvs.en interval-eller ratio-variabel) eller kategoriske (dvs. en ordinær eller nominel variabel). For eksempler på kontinuerlige og ordinære variabler, se kuglen ovenfor. Eksempler på nominelle variabler omfatter køn (f. eks. 2 grupper: mand og kvinde), etnicitet (f. eks.,, 3 grupper: kaukasisk, afroamerikansk og latinamerikansk), fysisk aktivitetsniveau (f.4 grupper: stillesiddende, lav, moderat og høj), erhverv (f. 5 grupper: kirurg, Læge, Sygeplejerske, tandlæge, terapeut) og så videre. Igen kan du lære mere om variabler i vores artikel: Variabeltyper. Hvis en af dine uafhængige variabler er dikotom og betragtes som en modererende variabel, skal du muligvis køre en dikotom moderatoranalyse.3: Du skal have uafhængighed af observationer (dvs.,, uafhængighed af rester), som du nemt kan kontrollere ved hjælp af Durbin-.atson-statistikken, som er en simpel test, der skal køres ved hjælp af SPSS-statistikker. Vi forklarer, hvordan du fortolker resultatet af Durbin-.atson-statistikken, samt viser dig den krævede SPSS-Statistikprocedure i vores enhanced multiple regression guide.
  • Antagelse #4: Der skal være en lineær sammenhæng mellem a) den afhængige variabel og hver af dine uafhængige variable, og b) den afhængige variabel og de uafhængige variable i fællesskab., Selvom der er en række måder at kontrollere for disse lineære forhold, foreslår vi at oprette scatterplots og delvise regressionsplotter ved hjælp af SPSS-statistikker, og derefter visuelt inspicere disse scatterplots og delvise regressionsplots for at kontrollere for linearitet. Hvis forholdet, der vises i dine scatterplots og delvise regressionsplotter, ikke er lineært, skal du enten køre en ikke-lineær regressionsanalyse eller “omdanne” dine data, som du kan gøre ved hjælp af SPSS-statistikker., I vores udvidede multiple regression guide viser vi dig, hvordan til at: (a) opret scatterplots og partial regression plots for at tjekke for linearitet, når de udfører multiple regression ved hjælp af SPSS Statistics; (b) fortolke forskellige scatterplot og partielle regression plot resultater; og (c) omdanne dine data ved hjælp af SPSS Statistics, hvis du ikke har lineære relationer mellem variabler.5: Dine data skal vise homoscedasticitet, hvilket er hvor afvigelserne langs linjen med bedste pasform forbliver ens, når du bevæger dig langs linjen., Vi forklarer mere om, hvad dette betyder, og hvordan du vurderer homoscedasticiteten af dine data i vores enhanced multiple regression guide. Når du analyserer dine egne data, skal du plotte de studenterede rester mod de ustandardiserede forudsagte værdier. I vores enhanced multiple regression guide forklarer vi: (a) hvordan man tester for homoscedasticitet ved hjælp af SPSS-statistikker; (b) nogle af de ting, du skal overveje, når du fortolker dine data; og (C) mulige måder at fortsætte med din analyse, hvis dine data ikke opfylder denne antagelse.,
  • Antagelse #6: Din data må ikke vise multicollinearity, som opstår, når du har to eller flere uafhængige variabler, der er stærkt korreleret med hinanden. Dette fører til problemer med at forstå, hvilken uafhængig variabel der bidrager til variansen forklaret i den afhængige variabel, samt tekniske problemer ved beregning af en multipel regressionsmodel., Derfor, i vores forbedrede multiple regression guide viser vi dig til: a) at anvende SPSS Statistics at opdage for multicollinearity gennem en inspektion af korrelationskoefficienter og Tolerance/VIF værdier; og (b) hvordan skal man fortolke disse korrelationskoefficienter og Tolerance/VIF værdier, så du kan bestemme, om dine data opfylder eller overtræder denne antagelse.7: der bør ikke være nogen signifikante outliers, høje gearingspunkter eller meget indflydelsesrige punkter., Outliers, gearing og indflydelsesrige punkter er forskellige udtryk, der bruges til at repræsentere observationer i dit datasæt, der på en eller anden måde er usædvanlige, når du ønsker at udføre en multipel regressionsanalyse. Disse forskellige klassifikationer af usædvanlige punkter afspejler de forskellige virkninger, de har på regressionslinjen. En observation kan klassificeres som mere end en type usædvanligt punkt. Imidlertid kan alle disse punkter have en meget negativ effekt på regressionsligningen, der bruges til at forudsige værdien af den afhængige variabel baseret på de uafhængige variabler., Dette kan ændre det output, som SPSS-statistikker producerer, og reducere forudsigelsesnøjagtigheden af dine resultater såvel som den statistiske betydning. Heldigvis, når du bruger SPSS-statistikker til at køre flere regression på dine data, kan du registrere mulige outliers, høje gearingspunkter og meget indflydelsesrige punkter., I vores udvidede multiple regression guide, vil vi: (a) vise dig, hvordan til at opdage outliers ved hjælp af “casewise diagnose” og “studentized slettet rester”, som du kan gøre ved hjælp af SPSS Statistics, og diskutere nogle af de muligheder, du har for at beskæftige sig med outliers; (b) ind for leverage point ved hjælp af SPSS Statistik og tal om, hvad du skal gøre, hvis du har nogen; og (c) ind til indflydelsesrige point i SPSS Statistik ved hjælp af et mål for indflydelse kendt som Cook ‘ s Afstand, før præsentere nogle praktiske tilgange i SPSS Statistics at beskæftige sig med nogen indflydelsesrige punkter, du måske har.,8: Endelig skal du kontrollere, at restene (fejl) er omtrent normalt fordelt (vi forklarer disse udtryk i vores enhanced multiple regression guide). To almindelige metoder til at kontrollere denne antagelse inkluderer anvendelse af: (A) et histogram (med en overlejret normal kurve) og et normalt P-P-Plot; eller (b) et normalt Plot-Plot-Plot af de studenterede rester., Igen, i vores forbedrede multiple regression guide, vil vi: (a) vise dig, hvordan til at efterprøve denne antagelse ved hjælp af SPSS Statistics, uanset om du bruger et histogram (med overlejret normale kurve) og Normal P-P Plot, eller Normal Q-Q Plot; (b) gør rede for, hvordan man skal fortolke disse diagrammer; og (c) give en mulig løsning, hvis dine data ikke opfylder denne antagelse.

Du kan kontrollere antagelser #3, #4, #5, #6, #7 og # 8 ved hjælp af SPSS statistik. Forudsætninger # 1 og # 2 bør kontrolleres først, før du går videre til antagelser #3, #4, #5, #6, #7 og # 8., Bare husk, at hvis du ikke kører de statistiske tests på disse antagelser korrekt, er de resultater, du får, når du kører flere regression, muligvis ikke gyldige. Det er derfor, vi dedikerer en række sektioner af vores enhanced multiple regression guide til at hjælpe dig med at få denne ret. Du kan finde ud af om vores forbedrede indhold som helhed på vores funktioner: oversigtsside, eller mere specifikt, lære, hvordan vi hjælper med at teste antagelser på vores funktioner: antagelser side.,

i afsnittet Procedure illustrerer vi SPSS-Statistikproceduren for at udføre en multipel regression under forudsætning af, at ingen antagelser er blevet overtrådt. Først introducerer vi det eksempel, der bruges i denne vejledning.

SPSS statistik

eksempel

en sundhedsforsker ønsker at kunne forudsige “Vo2ma.”, en indikator for fitness og sundhed. Normalt for at udføre denne procedure kræver dyrt laboratorieudstyr og nødvendiggør, at en individuel øvelse til deres maksimale (dvs. indtil de længere kan fortsætte med at udøve på grund af fysisk udmattelse)., Dette kan udskyde de personer, der ikke er meget aktive/fit og de personer, der kan være i højere risiko for dårligt helbred (f older ældre uegnede personer). Af disse grunde har det været ønskeligt at finde en måde at forudsige en persons Vo2ma.baseret på attributter, der kan måles lettere og billigt. Til dette formål rekrutterede en forsker 100 deltagere til at udføre en maksimal Vo2ma. – test, men registrerede også deres “alder”, “vægt”, “hjerterytme” og “køn”. Puls er gennemsnittet af de sidste 5 minutter af en 20 minut, meget lettere, lavere arbejdsbyrde cykling test., Forskerens mål er at kunne forudsige Vo2ma.baseret på disse fire attributter: alder, vægt, puls og køn.

SPSS Statistik

Opsætning i SPSS Statistik

I SPSS Statistics, vi har skabt seks variabler: (1) VO2max, hvilket er den maksimale aerobe kapacitet; (2) alder, som er deltagerens alder; (3) vægt, som er deltagerens vægt (teknisk, det er deres “masse”); (4) heart_rate, som er deltagerens puls; (5) køn, der er deltagerens køn; og (6) caseno, som er nummeret på den sag., Caseno-variablen bruges til at gøre det nemt for dig at fjerne sager (f. “betydelige outliers”, “high gearing points” og “highly influential points”), som du har identificeret, når du kontrollerer antagelser. I vores enhanced multiple regression guide viser vi dig, hvordan du korrekt indtaster data i SPSS-statistikker for at køre en multipel regression, når du også kontrollerer antagelser. Du kan lære om vores forbedrede dataopsætningsindhold på vores funktioner: Dataopsætningsside. Skiftevis, se vores generiske,” quickuick start ” guide: indtastning af Data i SPSS statistik.,

SPSS Statistik

Test Procedure i SPSS Statistik

De syv trin nedenfor viser, hvordan du analysere dine data ved hjælp af multipel regression i SPSS Statistics, når ingen af de otte forudsætninger i det foregående afsnit, Antagelser, er blevet krænket. I slutningen af disse syv trin viser vi dig, hvordan du fortolker resultaterne fra din flere regression., Hvis du leder efter hjælp til at sikre, at dine data opfylder antagelser #3, #4, #5, #6, #7 og # 8, som er påkrævet, når du bruger flere regression og kan testes ved hjælp af SPSS-statistikker, kan du lære mere i vores forbedrede guide (Se vores funktioner: oversigtsside for at lære mere).

  1. Klik Analysere > Regression > Lineær… på hovedmenuen, som vist nedenfor:

    Udgivet med skriftlig tilladelse fra SPSS Statistics, IBM Corporation.,

    Bemærk: Du skal ikke bekymre dig om, at du vælger analyser >Regression > lineær… i hovedmenuen, eller at dialogbokse i de følgende trin har titlen, lineær Regression. Du har ikke lavet en fejl. Du er på det rigtige sted for at udføre proceduren med flere regression. Dette er bare den titel, som SPSS statistik giver, selv når du kører en multipel regression procedure.,

  2. Du vil blive præsenteret for den Lineære Regression dialog boksen nedenfor:

    Udgivet med skriftlig tilladelse fra SPSS Statistics, IBM Corporation.,

  3. Overfør den afhængige variabel, VO2max, i den Afhængige: – kassen, og de uafhængige variable, alder, vægt, heart_rate og køn i den Uafhængige(s): – kassen, ved brug af knapper, som vist nedenfor (alle andre felter kan ignoreres):

    Udgivet med skriftlig tilladelse fra SPSS Statistics, IBM Corporation.,

    Bemærk: Efter en standard multipel regression, skal du ignorere og knapperne, da de er for sekventiel (hierarkisk) multiple regression. Metoden: indstillingen skal holdes ved standardværdien, som er . Hvis ikke er valgt, skal du ændre metode: tilbage til . Metoden er navnet givet af SPSS-statistikker til standardregressionsanalyse.,

  4. Klik på knappen. Du vil blive præsenteret for den Lineære Regression: Statistik dialog boks, som vist nedenfor:

    Udgivet med skriftlig tilladelse fra SPSS Statistics, IBM Corporation.

  5. ud over de indstillinger, der er valgt som standard, skal du vælge konfidensintervaller i –regressionskoefficienter– området, der forlader niveauet(%): mulighed ved “95”., Du vil ende op med følgende skærmbillede:

    Udgivet med skriftlig tilladelse fra SPSS Statistics, IBM Corporation.

  6. Klik på knappen. Du vil blive returneret til den lineære Regression dialogboks.
  7. Klik på knappen. Dette vil generere output.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *