Innledning
Flere regresjon er en forlengelse av enkel lineær regresjon. Den brukes når vi ønsker å forutsi verdien av en variabel basert på verdien av to eller flere andre variabler. Den variabelen vi ønsker å forutsi kalles den avhengige variabelen (eller noen ganger, utfallet, mål eller kriteriet variabel)., Variablene vi bruker til å forutsi verdien på den avhengige variabelen kalles uavhengige variabler (eller noen ganger, prediktor, forklarende eller regressor variabler).
For eksempel, du kan bruke multippel regresjon for å forstå om eksamen kan ytelsen bli spådd basert på revisjon tid, test angst, foredrag deltakelse og likestilling. Alternativt, kan du bruke multippel regresjon for å forstå om daglig sigarett forbruk kan forutsies basert på røyking varighet, alder, da begynte røyking, røyker type, inntekt og kjønn.,
Flere regresjon gir deg også mulighet til å bestemme den generelle passe (forklart varians) modell og den relative bidraget fra hver av prediktorer til den totale variansen forklart. For eksempel, du kanskje vil vite hvor mye av variasjonen i eksamen ytelse kan forklares ved revisjon tid, test angst, foredrag deltakelse og likestilling «som en helhet», men også den «relative bidrag» for hver uavhengig variabel for å forklare variansen.,
Denne «rask start» guide viser deg hvordan du kan utføre flere regresjon ved hjelp av SPSS Statistikk, samt tolke og rapportere resultatene fra denne testen. Men før vi introdusere deg til denne prosedyren, må du forstå ulike forutsetninger for at dataene må møte for multippel regresjon for å gi deg et gyldig resultat. Vi drøfte disse forutsetningene neste.,
SPSS Statistikk
Forutsetninger
Når du velger å analysere dine data ved hjelp av multippel regresjon, som er en del av prosessen omfatter kontroll for å sikre at dataene du vil analysere faktisk kan bli analysert ved hjelp av multippel regresjon. Du må gjøre dette fordi det er bare aktuelt å bruke flere regresjon hvis dataene «passerer» åtte forutsetninger som er nødvendige for multippel regresjon for å gi deg et gyldig resultat., I praksis kontrollere for disse åtte forutsetninger bare legger litt mer tid til analyse, som krever deg til å klikke på et par knapper i SPSS Statistikk når du utfører din analyse, samt tenke litt mer om dine data, men det er ikke en vanskelig oppgave.
Før vi introdusere deg til disse åtte forutsetninger, bli ikke overrasket om, når og analysere egne data ved hjelp av SPSS Statistikk, ett eller flere av disse forutsetningene er brutt (dvs., ikke er oppfylt)., Dette er ikke uvanlig når du arbeider med reelle data snarere enn lærebok eksempler, som ofte bare vise deg hvordan du kan utføre flere regresjon når alt går bra! Likevel, ikke bekymre deg. Selv når data mislykkes visse forutsetninger, er det ofte en løsning for å overvinne dette. Først, la oss ta en titt på disse åtte forutsetninger:
- Forutsetning #1: Den avhengige variabelen bør måles på en kontinuerlig skala (dvs., det er enten en intervall eller forholdet variabel)., Eksempler på variabler som oppfyller dette kriteriet omfatter revisjon tid (målt i timer), intelligensen (målt ved hjelp av IQ-score), eksamen ytelse (målt fra 0 til 100), vekt (målt i kg), og så videre. Du kan lære mer om intervall og forholdet variabler i vår artikkel: Typer av Variable. Hvis den avhengige variabelen ble målt på en ordenstallet skala, vil du trenger for å gjennomføre ordenstallet regresjon snarere enn multippel regresjon. Eksempler på ordenstallet variabler inkluderer Likert elementer (f.eks.,, en 7-punkts skala fra «helt enig» til «helt uenig»), blant andre måter rangering kategorier (f.eks., en 3-punkts skala som forklarer hvor mye en kunde likte et produkt, alt fra «Ikke veldig mye» til «Ja, mye»).
- Forutsetning #2: Du har to eller flere uavhengige variabler, som kan være enten kontinuerlig (dvs., et intervall eller forholdet variabel) eller kategoriske (dvs., en ordenstallet eller nominell variabel). For eksempler på kontinuerlige og ordenstallet variabler, se punkt ovenfor. Eksempler på nominelle variabler inkluderer kjønn (f.eks., 2 grupper: mannlige og kvinnelige), etnisitet (f.eks.,, 3 grupper: Europerer, Afrikansk Amerikansk og Spansk), fysisk aktivitet (f.eks., 4 grupper: stillesittende, lav, moderat og høy), yrke (f.eks., 5 grupper: kirurg, lege, sykepleier, tannlege, terapeut), og så videre. Igjen, du kan lære mer om variabler i vår artikkel: Typer av Variable. Hvis en av dine uavhengige variabler er dichotomous og regnes som en modererende variabel, kanskje du trenger for å kjøre en Dichotomous moderator analyse.
- Forutsetningen #3: Du bør ha uavhengighet av observasjoner (dvs.,, uavhengighet av rester), som du kan enkelt sjekke ved hjelp av Durbin-Watson-statistikken, som er en enkel test for å kjøre ved hjelp av SPSS Statistikk. Vi forklarer hvordan du skal tolke resultatet av Durbin-Watson-statistikken, så vel som å vise deg den SPSS Statistikk prosedyren er nødvendig, i vår forbedrede multippel regresjon guide.
- Forutsetningen #4: Det må være en lineær sammenheng mellom (a) den avhengige variabelen og hver av de uavhengige variablene, og (b) den avhengige variabelen og de uavhengige variablene samlet., Mens det er en rekke måter å kontrollere for disse lineære relasjoner, anbefaler vi at du oppretter scatterplots og delvis regresjon tomter ved hjelp av SPSS Statistikk, og deretter visuelt inspisere disse scatterplots og delvis regresjon plott for å sjekke om linearitet. Hvis forholdet vises i din scatterplots og delvis regresjon tomter er ikke lineær, må du enten kjøre en ikke-lineær regresjonsanalyse eller «transformere» dine data, som du kan gjøre ved hjelp av SPSS Statistikk., I vår forbedrede multippel regresjon guiden viser vi deg hvordan å: (a) lag scatterplots og delvis regresjon plott for å sjekke for linearitet ved å gjennomføre flere regresjon ved hjelp av SPSS Statistikk; (b) tolke ulike scatterplot og delvis regresjon tomten resultater; og (c) forvandle dine data ved hjelp av SPSS Statistikk hvis du ikke har lineære sammenhenger mellom variablene.
- Forutsetningen #5: dataene Dine behov for å vise homoscedasticity, som er der avvik langs den linjen som passer best forbli lignende som du beveger deg langs linjen., Vi forklarer mer om hva dette betyr og hvordan å vurdere homoscedasticity av dine data i våre forbedret multippel regresjon guide. Når du analysere dine egne data, vil du trenger for å plotte studentized restene mot unstandardized predikerte verdier. I vår forbedrede multippel regresjon guiden forklarer vi: (a) hvordan teste for homoscedasticity ved hjelp av SPSS Statistikk; (b) er det noen ting du må vurdere når du tolke data, og (c) mulige måter å fortsette med din analyse hvis dataene ikke klarer å oppfylle denne forutsetningen.,
- Forutsetningen #6: Dine data skal ikke vise multicollinearity, som oppstår når du har to eller flere uavhengige variabler som er høyt korrelert med hverandre. Dette fører til problemer med å forstå som uavhengig variabel bidrar til forklart varians i den avhengige variabelen, samt tekniske problemer ved beregning av en multippel regresjonsmodell., Derfor, i vår forbedrede multippel regresjon guiden viser vi deg: (a) hvordan bruke SPSS Statistikk å oppdage for multicollinearity gjennom en inspeksjon av korrelasjon koeffisienter og Toleranse/VIF-verdier; og (b) hvordan du skal tolke disse korrelasjon koeffisienter og Toleranse/VIF-verdier, slik at du kan avgjøre om dataene oppfyller eller bryter med denne forutsetning.
- Forutsetningen #7: Det skal ikke være noen betydelige uteliggere, høy giring poeng eller svært innflytelsesrike poeng., Uteliggere, innflytelse og innflytelsesrike poeng er ulike begreper som brukes for å representere observasjoner i datasettet som er på noen måte uvanlig når du ønsker å utføre en multippel regresjonsanalyse. Disse ulike klassifiseringer av uvanlige poeng gjenspeiler de ulike innvirkning de har på regresjons-linje. En observasjon kan være klassifisert som mer enn en type uvanlig punkt. Men alle disse punktene kan ha en svært negativ effekt på den regresjonsligningen som brukes til å forutsi verdien på den avhengige variabelen basert på uavhengige variabler., Dette kan endre utgang som SPSS Statistikk produserer og redusere logisk nøyaktigheten av resultatene samt statistisk signifikans. Heldigvis, ved bruk av SPSS Statistikk for å kjøre flere regresjon på dine data, kan du oppdage mulige uteliggere, høy giring poeng og svært innflytelsesrike poeng., I vår forbedrede multippel regresjon guide, vi: (a) vis hvordan du kan oppdage uteliggere ved hjelp av «casewise diagnostics» og «studentized slettet restene», som du kan gjøre ved hjelp av SPSS Statistikk, og diskutere noen av alternativene du har for å håndtere ekstreme verdier; (b) sjekk for å utnytte poeng ved hjelp av SPSS Statistikk og diskutere hva du bør gjøre hvis du har noen, og (c) sjekk for innflytelsesrike poeng i SPSS Statistikk ved hjelp av en måling av innflytelse er kjent som Cook ‘ s Distance, før du presenterer noen praktiske tilnærminger i SPSS Statistikk for å håndtere alle innflytelsesrike poeng du kan ha.,
- Forutsetningen #8: Endelig, må du kontrollere at restene (feil) er tilnærmet normalfordelt (vi forklare disse begrepene i vår forbedrede multippel regresjon guide). To vanlige metoder for å kontrollere denne antakelsen inkluderer bruk av: (a) et histogram (med en lagt normal kurve) og en Normal P-P Plot; eller (b) en Normal Q-Q-Plott av studentized restene., Igjen, i vår forbedrede multippel regresjon guide, vi: (a) viser deg hvordan du kontrollerer denne antakelsen ved hjelp av SPSS Statistikk, uansett om du bruker et histogram (sammenliknet med normal kurve) og Normal P-P-Plott, eller Normal Q-Q Plot; (b) forklar hvordan du skal tolke disse diagrammene; og (c) gi en mulig løsning hvis dataene ikke klarer å oppfylle denne forutsetningen.
Du kan sjekke forutsetninger #3, #4, #5, #6, #7 og #8 ved hjelp av SPSS Statistikk. Forutsetninger #1 og #2 skal være sjekket først, før du flytter på forutsetninger #3, #4, #5, #6, #7 og #8., Bare husk at hvis du ikke kjøre den statistiske tester på disse forutsetningene riktig, resultatene du får når du kjører flere regresjon kan ikke være gyldig. Dette er grunnen til at vi vier en rekke deler av vår utvidede multippel regresjon guide for å hjelpe deg med å få dette riktig. Du kan finne ut mer om våre utvidet innhold som helhet på nettsidene våre: Oversikt side, eller mer spesifikt, lære hvordan vi hjelpe med å teste antakelsene våre Funksjoner: Forutsetninger side.,
I den delen, Prosedyre, vi illustrere SPSS Statistikk prosedyre for å utføre en multippel regresjon, forutsatt at ingen forutsetninger har blitt brutt. For det første, vi introdusere eksempel som er brukt i denne brukerhåndboken.
SPSS Statistikk
Eksempel
helse-forsker ønsker å være i stand til å forutsi «VO2max», en indikator på trening og helse. Normalt, for å utføre denne prosedyren krever kostbart laboratorieutstyr og nødvendiggjør at en individuell øvelse til sitt maksimale (dvs., inntil de ikke lenger kan fortsette å trene på grunn av fysisk utmattelse)., Dette kan sette av de personer som er ikke veldig aktiv/monter og de personer som kan være utsatt for høyere risiko for dårlig helse (f.eks., eldre uegnet fag). For disse grunner, det har vært ønskelig å finne en måte å forutsi en persons VO2max basert på egenskaper som kan måles mer enkelt og billig. For dette formål, forsker rekruttert 100 deltakere til å utføre en maksimal VO2max test, men også spilt inn sine «alder», «vekt», «puls» og «kjønn». Puls er gjennomsnitt for de siste 5 minuttene av en 20 minutters mye lettere, lavere arbeidsbelastning sykling test., Forskeren har som mål å være i stand til å forutsi VO2max basert på disse fire egenskaper: alder, vekt, puls og kjønn.
SPSS Statistikk
Oppsett i SPSS Statistikk
I SPSS Statistikk, vi skapte seks variabler: (1) VO2max, som er den maksimale aerobe kapasitet; (2) alder som er deltakerens alder; (3) vekt, som er deltaker vekt (teknisk, det er deres ‘masse’); (4) heart_rate, som er deltaker puls; (5) kjønn, som er deltakerens kjønn; og (6) caseno, som er tilfelle nummer., Den caseno variabelen er brukt for å gjøre det enkelt for deg å eliminere tilfeller (f.eks., «betydelig uteliggere», «høy giring poeng» og «svært innflytelsesrike poeng») som du har identifisert ved søk etter forutsetningene. I vår forbedrede multippel regresjon guiden viser vi deg hvordan du skal skrive inn data i SPSS Statistikk for å kjøre en multippel regresjon når du er også sjekker for forutsetninger. Du kan lære mer om vår enhanced data oppsett av innhold på nettsidene våre: Data Oppsett. Vekselvis, se vår generisk, «rask start» guide: å legge Inn Data i SPSS Statistikk.,
SPSS Statistikk
Test Prosedyre i SPSS Statistikk
De syv trinnene nedenfor viser deg hvordan å analysere dine data ved hjelp av multippel regresjon i SPSS Statistikk når ingen av de åtte antakelser i den forrige delen, Forutsetninger, har blitt brutt. På slutten av disse syv trinn, kan vi vise deg hvordan du skal tolke resultatene fra multippel regresjon., Hvis du er på jakt etter hjelp til å sørge for at dataene oppfyller forutsetninger #3, #4, #5, #6, #7 og #8, som er nødvendig ved bruk av multippel regresjon og kan bli testet ved hjelp av SPSS Statistikk, du kan lese mer i vår forbedrede guide (se våre Funksjoner: Oversikt side for å lære mer).
- Klikk Analysere > Regresjon > Lineær… på hovedmenyen, som vist nedenfor:
Publisert med tillatelse fra SPSS Statistikk, IBM Corporation.,
Merk: ikke bry deg om at du velger Analysere > Regresjon > Lineær… på hovedmenyen, eller at dialog bokser i trinnene som følger, har tittelen, Lineær Regresjon. Du har ikke gjort en feil. Du er på riktig sted for å utføre multippel regresjon prosedyre. Dette er bare tittelen som SPSS Statistikk gir, selv når du kjører en multippel regresjon prosedyre.,
- Du vil bli presentert med Lineær Regresjon dialog boksen nedenfor:
Publisert med tillatelse fra SPSS Statistikk, IBM Corporation.,
- Overfør den avhengige variabelen, VO2max, i den Avhengige: boks og de uavhengige variablene, alder, vekt, heart_rate og kjønn i den Uavhengige(s):), bruk knapper, som vist nedenfor (alle andre boksene kan bli ignorert):
Publisert med tillatelse fra SPSS Statistikk, IBM Corporation.,
Merk: For en standard multippel regresjon du bør ignorere og knappene som de er for seriefotografering (hierarkisk) multippel regresjon. Metode: alternativ må holdes på standardverdien, som er . Hvis, uansett grunn, ikke er valgt, må du endre Metode: tilbake til . metoden er navnet gitt av SPSS Statistikk standard regresjonsanalyse.,
- Klikk på – knappen. Du vil bli presentert med Lineær Regresjon: Statistisk dialog-boksen, som vist nedenfor:
Publisert med tillatelse fra SPSS Statistikk, IBM Corporation.
- I tillegg til alternativene som er valgt som standard, velger du konfidensintervaller i –Regresjon Koeffisientene– området forlater Nivå(%): valget på «95»., Du vil ende opp med følgende skjermbilde:
Publisert med tillatelse fra SPSS Statistikk, IBM Corporation.
- Klikk på – knappen. Du vil bli returnert til Lineær Regresjon dialog boksen.
- Klikk på – knappen. Dette vil generere utdata.
Legg igjen en kommentar