Cum se efectuează o analiză de regresie multiplă în statisticile SPSS | Statisticile LAERD

Introducere

regresia multiplă este o extensie a regresiei liniare simple. Este folosit atunci când dorim să prezicem valoarea unei variabile bazată pe valoarea a două sau mai multe alte variabile. Variabila pe care dorim să o prezicem se numește variabila dependentă (sau, uneori, variabila de rezultat, țintă sau criteriu)., Variabilele pe care le folosim pentru a prezice valoarea variabilei dependente sunt numite variabile independente (sau, uneori, variabilele predictor, explicative sau regresoare).de exemplu, puteți utiliza regresia multiplă pentru a înțelege dacă performanța examenului poate fi prezisă pe baza timpului de revizuire, a anxietății de testare, a participării la cursuri și a sexului. În mod alternativ, puteți utiliza regresia multiplă pentru a înțelege dacă consumul zilnic de țigări poate fi prezis în funcție de durata fumatului, vârsta la care a început fumatul, tipul fumătorului, venitul și sexul.,regresia multiplă vă permite, de asemenea, să determinați potrivirea generală (varianța explicată) a modelului și contribuția relativă a fiecăruia dintre predictori la varianța totală explicată. De exemplu, ați putea dori să știți cât de mult din variația performanței examenului poate fi explicată prin timpul de revizuire, anxietatea de testare, participarea la cursuri și sexul „în ansamblu”, dar și „contribuția relativă” a fiecărei variabile independente în explicarea varianței.,acest ghid „pornire rapidă” vă arată cum să efectuați regresia multiplă folosind statisticile SPSS, precum și să interpretați și să raportați rezultatele acestui test. Cu toate acestea, înainte de a vă prezenta această procedură, trebuie să înțelegeți diferitele ipoteze pe care datele dvs. trebuie să le îndeplinească pentru ca regresia multiplă să vă ofere un rezultat valid. Vom discuta aceste ipoteze în continuare.,

statistici SPSS

ipoteze

când alegeți să analizați datele utilizând regresia multiplă, o parte a procesului implică verificarea pentru a vă asigura că datele pe care doriți să le analizați pot fi de fapt analizate folosind regresia multiplă. Trebuie să faceți acest lucru deoarece este adecvat să utilizați regresia multiplă numai dacă datele dvs. „trec” opt ipoteze care sunt necesare pentru regresia multiplă pentru a vă oferi un rezultat valid., În practică, verificarea acestor opt ipoteze adaugă doar un pic mai mult timp analizei dvs., necesitând să faceți clic pe alte câteva butoane din statisticile SPSS atunci când efectuați analiza, precum și să vă gândiți puțin mai mult la datele dvs., dar nu este o sarcină dificilă.înainte de a vă prezenta aceste opt ipoteze, nu vă mirați dacă, atunci când analizați propriile date folosind statistici SPSS, una sau mai multe dintre aceste ipoteze sunt încălcate (adică nu sunt îndeplinite)., Acest lucru nu este neobișnuit atunci când lucrați cu date din lumea reală, mai degrabă decât Exemple de manuale, care adesea vă arată doar cum să efectuați regresii multiple atunci când totul merge bine! Cu toate acestea, nu vă faceți griji. Chiar și atunci când datele dvs. nu reușesc anumite ipoteze, există adesea o soluție pentru a depăși acest lucru. În primul rând, să aruncăm o privire la aceste opt ipoteze:

ipoteza #1: variabila dvs. dependentă trebuie măsurată pe o scară continuă (adică este fie o variabilă interval sau raport)., Exemple de variabile care îndeplinesc acest criteriu includ timpul de revizuire (măsurat în ore), inteligența (măsurată folosind scorul IQ), performanța examenului (măsurată de la 0 la 100), greutatea (măsurată în kg) și așa mai departe. Puteți afla mai multe despre Variabilele intervalului și raportului în articolul nostru: tipuri de variabile. Dacă variabila dvs. dependentă a fost măsurată pe o scară ordinală, va trebui să efectuați regresia ordinală, mai degrabă decât regresia multiplă. Exemple de variabile ordinale includ elemente Likert (de ex., 7-scală de la „foarte de acord” până la „acord puternic”), printre alte moduri de clasificare a categoriilor (de exemplu, o scală de 3 puncte, explicând cât de mult un client a placut un produs, variind de la „foarte mult” la „Da, o mulțime”).
ipoteza # 2: aveți două sau mai multe variabile independente, care pot fi continue (adică o variabilă de interval sau raport) sau categorice (adică o variabilă ordinală sau nominală). Pentru exemple de variabile continue și ordinale, consultați glonțul de mai sus. Exemple de variabile nominale includ sexul (de exemplu, 2 grupuri: masculin și feminin), etnia( de exemplu ,,, 3 grupe: caucazian, afro-American și Hispanic), nivelul de activitate fizică (de exemplu, 4 grupe: sedentar, scăzut, moderat și înalt), profesie (de exemplu, 5 grupe: chirurg, medic, asistent medical, dentist, terapeut), și așa mai departe. Din nou, puteți afla mai multe despre variabile în articolul nostru: tipuri de variabile. Dacă una dintre variabilele dvs. independente este dihotomă și este considerată o variabilă moderatoare, este posibil să fie necesar să rulați o analiză moderatoare dihotomă.
ipoteza # 3: ar trebui să aveți independența observațiilor (adică.,, independența reziduurilor), pe care le puteți verifica cu ușurință folosind statistica Durbin-Watson, care este un test simplu de rulat folosind statisticile SPSS. Vă explicăm cum să interpretați rezultatul statisticii Durbin-Watson, precum și să vă arătăm procedura de Statistică SPSS necesară, în ghidul nostru îmbunătățit de regresie multiplă.
ipoteza # 4: trebuie să existe o relație liniară între (a) variabila dependentă și fiecare dintre variabilele dvs. independente și (b) variabila dependentă și variabilele independente colectiv., În timp ce există un număr de moduri de a verifica dacă aceste relații liniare, vă sugerăm crearea scatterplots și regresie parțială parcele cu ajutorul programului SPSS Statistics, și apoi inspecta vizual aceste scatterplots și regresie parțială parcele pentru a verifica liniaritatea. Dacă relația afișată în scatterplots și parcele de regresie parțială nu sunt liniare, va trebui fie să executați o analiză de regresie neliniară, fie să „transformați” datele dvs., pe care le puteți face folosind statisticile SPSS., În îmbunătățite de regresie multiplă ghid, vă vom arăta cum să: (a) crea scatterplots și regresie parțială parcele pentru a verifica liniaritatea atunci când se efectuează regresia multiplă folosind SPSS Statistics; (b) să interpreteze diferite scatterplot și regresie parțială complot rezultate; și (c) transformarea datelor folosind SPSS Statistics, dacă nu aveți relații liniare între variabile.
ipoteza # 5: datele dvs. trebuie să arate homoscedasticitate, care este locul în care variațiile de-a lungul liniei de cea mai bună potrivire rămân similare pe măsură ce vă deplasați de-a lungul liniei., Vă explicăm mai multe despre ce înseamnă acest lucru și cum să evaluați homoscedasticitatea datelor dvs. în ghidul nostru îmbunătățit de regresie multiplă. Când analizați propriile date, va trebui să trasați reziduurile studentizate împotriva valorilor prezise nestandardizate. În ghidul nostru îmbunătățit de regresie multiplă, vă explicăm: (a) cum să testați homoscedasticitatea folosind statisticile SPSS; (b) unele dintre lucrurile pe care va trebui să le luați în considerare la interpretarea datelor dvs.; și (c) modalități posibile de a continua analiza dacă datele dvs. nu îndeplinesc această presupunere.,
ipoteza # 6: datele dvs. nu trebuie să arate multicolinearitate, care apare atunci când aveți două sau mai multe variabile independente care sunt foarte corelate între ele. Acest lucru duce la probleme cu înțelegerea variabilei independente care contribuie la varianța explicată în variabila dependentă, precum și probleme tehnice în calcularea unui model de regresie multiplă., Prin urmare, în îmbunătățite de regresie multiplă ghid, vă vom arăta: (a) modul de utilizare SPSS Statistics pentru a detecta pentru multicoliniaritate printr-o inspecție a coeficienților de corelație și de Toleranță/VIF valori; și (b) cum să interpreteze aceste coeficienții de corelație și de Toleranță/VIF valori, astfel încât să puteți determina dacă datele dvs. îndeplinește sau încalcă această ipoteză.
ipoteza #7: nu ar trebui să existe valori semnificative, puncte de pârghie ridicate sau puncte foarte influente., Valorile aberante, efectul de levier și punctele influente sunt termeni diferiți folosiți pentru a reprezenta observațiile din setul dvs. de date care sunt într-un fel neobișnuite atunci când doriți să efectuați o analiză de regresie multiplă. Aceste clasificări diferite ale punctelor neobișnuite reflectă impactul diferit pe care îl au asupra liniei de regresie. O observație poate fi clasificată ca mai mult de un tip de punct neobișnuit. Cu toate acestea, toate aceste puncte pot avea un efect foarte negativ asupra ecuației de regresie care este utilizată pentru a prezice valoarea variabilei dependente pe baza variabilelor independente., Acest lucru poate schimba rezultatul pe care statisticile SPSS îl produc și poate reduce precizia predictivă a rezultatelor dvs., precum și semnificația statistică. Din fericire, atunci când utilizați statistici SPSS pentru a rula regresie multiplă pe datele dvs., puteți detecta posibile valori aberante, puncte de pârghie ridicate și puncte foarte influente., În îmbunătățite de regresie multiplă ghid, avem: (a) arăta cum de a detecta aberante folosind „casewise diagnosticare” și „studentized elimină reziduurile”, pe care le puteți face cu ajutorul programului SPSS Statistics, și a discuta despre unele dintre opțiunile pe care le au în scopul de a face cu valorile aberante; (b) verificați pentru puncte de sprijin utilizând SPSS Statistics și de a discuta despre ceea ce trebuie să faceți dacă aveți orice; și (c) verificați pentru influente puncte în SPSS Statistics, folosind o măsură de influență cunoscut sub numele de Cook ‘ s Distance, înainte de a prezenta unele abordări practice în SPSS Statistics să se ocupe de orice influente puncte s-ar putea avea.,
ipoteza #8: în cele din urmă, trebuie să verificați dacă reziduurile (erorile) sunt distribuite aproximativ în mod normal (explicăm acești termeni în ghidul nostru îmbunătățit de regresie multiplă). Două metode comune pentru a verifica această ipoteză includ utilizarea: (a) o histogramă (cu o curbă normală suprapusă) și un complot P-P Normal; sau (b) un complot Q-Q normal al reziduurilor studentizate., Din nou, în ghidul nostru îmbunătățit de regresie multiplă, noi: (a) vă arătăm cum să verificați această ipoteză folosind statisticile SPSS, indiferent dacă utilizați o histogramă (cu o curbă normală suprapusă) și un complot P-P Normal sau un complot Q-Q normal; (b) explicați cum să interpretați aceste diagrame; și (c) furnizați o soluție posibilă dacă datele dvs. nu îndeplinesc această ipoteză.

puteți verifica ipotezele #3, #4, #5, #6, #7 și # 8 folosind statistici SPSS. Ipotezele #1 și #2 trebuie verificate mai întâi, înainte de a trece la ipoteze #3, #4, #5, #6, #7 și numărul 8., Amintiți-vă că, dacă nu executați corect testele statistice pe aceste ipoteze, rezultatele obținute la rularea regresiei multiple ar putea să nu fie valide. Acesta este motivul pentru care dedicăm o serie de secțiuni ale ghidului nostru de regresie multiplă îmbunătățită pentru a vă ajuta să obțineți acest drept. Puteți afla despre conținutul nostru îmbunătățit în ansamblu pe pagina Caracteristici: Prezentare generală sau, mai precis, aflați cum vă ajutăm cu testarea ipotezelor pe pagina Caracteristici: ipoteze.,

în secțiunea procedură, ilustrăm procedura statistică SPSS pentru a efectua o regresie multiplă presupunând că nu au fost încălcate ipoteze. În primul rând, introducem exemplul utilizat în acest ghid.

statistici SPSS

exemplu

un cercetător în domeniul Sănătății dorește să poată prezice „VO2max”, un indicator al fitnessului și al sănătății. În mod normal, pentru a efectua această procedură necesită echipamente de laborator costisitoare și necesită ca un exercițiu individual la maxim lor (adică, până când acestea pot continua mai mult exercitarea din cauza epuizării fizice)., Acest lucru poate pune în afara acelor persoane care nu sunt foarte active/se potrivesc și acele persoane care ar putea fi la risc mai mare de sănătate (de exemplu, subiecții improprii mai în vârstă). Din aceste motive, a fost de dorit să se găsească o modalitate de a prezice VO2max unui individ pe baza atributelor care pot fi măsurate mai ușor și mai ieftin. În acest scop, un cercetător a recrutat 100 de participanți pentru a efectua un test VO2max maxim, dar a înregistrat și „vârsta”, „greutatea”, „ritmul cardiac” și „sexul”. Ritmul cardiac este media ultimelor 5 minute ale unui test de ciclism de 20 de minute, mult mai ușor, mai mic., Scopul cercetătorului este de a putea prezice VO2max pe baza acestor patru atribute: vârsta, greutatea, ritmul cardiac și sexul.

SPSS Statistics

Configurare în SPSS Statistics

În SPSS Statistics, am creat șase variabile: (1) VO2max, care este capacitatea maximă aerobă; (2) vârsta, care este participantul de vârstă; (3) în greutate, care este participant e greutate (din punct de vedere tehnic, este lor „de masă”); (4) heart_rate, care este participant e de ritm cardiac; (5) de gen, care este participant de gen; și (6) caseno, care este numărul de caz., Variabila caseno este utilizată pentru a vă facilita eliminarea cazurilor (de exemplu, „valori semnificative”, „puncte de pârghie ridicate” și „puncte extrem de influente”) pe care le-ați identificat atunci când verificați ipotezele. În ghidul nostru îmbunătățit de regresie multiplă, vă arătăm cum să introduceți corect datele în statisticile SPSS pentru a rula o regresie multiplă atunci când verificați și presupunerile. Puteți afla despre conținutul nostru îmbunătățit de configurare a datelor pe pagina noastră Caracteristici: configurare date. Alternativ, consultați ghidul nostru generic, „pornire rapidă”: introducerea datelor în statisticile SPSS.,

statistici SPSS

procedura de testare în statisticile SPSS

cei șapte pași de mai jos vă arată cum să analizați datele utilizând regresia multiplă în statisticile SPSS atunci când niciuna dintre cele opt ipoteze din secțiunea anterioară, ipoteze, nu a fost încălcată. La sfârșitul acestor șapte pași, vă arătăm cum să interpretați rezultatele din regresia dvs. multiplă., Dacă sunteți în căutarea de ajutor pentru a vă asigura că datele dvs. îndeplinesc presupunerile #3, #4, #5, #6, #7 și # 8, care sunt necesare atunci când se utilizează regresie multiplă și pot fi testate folosind statisticile SPSS, puteți afla mai multe în ghidul nostru îmbunătățit (consultați pagina noastră Caracteristici: Prezentare generală pentru a afla mai multe).

faceți Clic pe analiză > Regresie > Liniare… în meniul principal, așa cum se arată mai jos:

Publicat cu permisiunea scrisă din SPSS Statistics, IBM Corporation.,

Notă: nu vă faceți griji că sunteți selectarea Analiza > Regresie > Liniare… în meniul principal sau că casetele de dialog din pașii care urmează au titlul, regresie liniară. Nu ai făcut o greșeală. Sunteți în locul corect pentru a efectua procedura de regresie multiplă. Acesta este doar titlul pe care îl oferă statisticile SPSS, chiar și atunci când se execută o procedură de regresie multiplă.,
Vă vor fi prezentate cu Regresia Liniară caseta de dialog de mai jos:

Publicat cu permisiunea scrisă din SPSS Statistics, IBM Corporation.,
Transfer variabila dependentă, VO2max, în Dependentă de: cutie, iar variabilele independente, vârstă, greutate, heart_rate și de gen în Independent(s): cutie, folosind butoane, așa cum se arată mai jos (toate celelalte cutii pot fi ignorate):

Publicat cu permisiunea scrisă din SPSS Statistics, IBM Corporation.,

Notă: Pentru un standard de regresie multiplă ar trebui să ignore și butoane ca acestea sunt pentru secvențială (ierarhic) de regresie multiplă. Metoda: opțiunea trebuie păstrată la valoarea implicită, care este . Dacă, din orice motiv, nu este selectat, trebuie să schimbați metoda: înapoi la . Metoda este numele dat de statisticile SPSS analizei de regresie standard.,
Faceți clic pe butonul . Vă vor fi prezentate cu Regresia Liniară: Statistici casetă de dialog, așa cum se arată mai jos:

Publicat cu permisiunea scrisă din SPSS Statistics, IBM Corporation.
în plus față de opțiunile selectate în mod implicit, selectați intervale de încredere în zona –coeficienții de regresie– lăsând opțiunea nivel(%): la „95”., Va termina cu următorul ecran:

Publicat cu permisiunea scrisă din SPSS Statistics, IBM Corporation.
Faceți clic pe butonul. Veți fi returnat la caseta de dialog regresie liniară.
Faceți clic pe butonul . Aceasta va genera ieșirea.

analiza de regresie multiplă folosind statisticile SPSS

Introducere

statistici SPSS

ipoteze

statistici SPSS

exemplu

SPSS Statistics

Configurare în SPSS Statistics

statistici SPSS

procedura de testare în statisticile SPSS

Lasă un răspuns Anulează răspunsul