Többszörös regressziós analízis végrehajtása az SPSS statisztikákban / Laerd statisztika

Bevezetés

a többszörös regresszió az egyszerű lineáris regresszió kiterjesztése. Ezt akkor használjuk, amikor egy változó értékét két vagy több más változó értéke alapján szeretnénk megjósolni. A megjósolni kívánt változót függő változónak (vagy néha az eredménynek, a célnak vagy a kritériumváltozónak) nevezzük., A függő változó értékének előrejelzésére használt változókat független változóknak (vagy néha prediktornak, magyarázó vagy regresszor változóknak) nevezzük.

például több regresszió segítségével meg lehet érteni, hogy a vizsga teljesítményét meg lehet-e jósolni a felülvizsgálati idő, a teszt szorongás, az előadások látogatása és a nem alapján. Alternatív megoldásként több regressziót is használhat annak megértéséhez, hogy a dohányzás időtartama, a dohányzás megkezdésének kora, a dohányosok típusa, jövedelme és neme alapján megjósolható-e a napi cigarettafogyasztás.,

többszörös regresszió is lehetővé teszi, hogy meghatározza a teljes fit (variancia magyarázható) a modell, valamint a relatív hozzájárulása az egyes prediktorok a teljes variancia magyarázható. Például érdemes tudni, hogy a vizsga teljesítményének változása mennyire magyarázható a felülvizsgálati idővel, a teszt szorongással, az előadás látogatottságával és a nemével “egészként”, hanem az egyes független változók “relatív hozzájárulásával” a variancia magyarázatában.,

Ez a” Gyorsindítás ” útmutató bemutatja, hogyan lehet többszörös regressziót végrehajtani az SPSS statisztikákkal, valamint értelmezni és jelenteni a teszt eredményeit. Mielőtt azonban bemutatnánk ezt az eljárást, meg kell értenie azokat a különböző feltételezéseket, amelyeknek az adatoknak meg kell felelniük ahhoz, hogy a többszörös regresszió érvényes eredményt adjon. Megvitatjuk ezeket a feltételezéseket.,

SPSS statisztika

feltételezések

Ha úgy dönt, hogy az adatokat több regresszió segítségével elemzi, a folyamat egy része ellenőrzi, hogy az elemezni kívánt adatok valóban több regresszió segítségével elemezhetők-e. Ezt meg kell tennie, mert csak akkor célszerű többszörös regressziót használni, ha az adatok “átmennek” nyolc feltételezést, amelyek szükségesek a többszörös regresszióhoz, hogy érvényes eredményt kapjanak., A gyakorlatban ennek a nyolc feltételezésnek az ellenőrzése csak egy kicsit több időt ad az elemzéshez, amely megköveteli, hogy az elemzés elvégzésekor még néhány gombot kattintson az SPSS statisztikákban, valamint gondoljon egy kicsit többet az adatairól, de ez nem nehéz feladat.

mielőtt bemutatnánk ezt a nyolc feltételezést, ne lepődj meg, ha a saját adatainak elemzésekor az SPSS statisztikák segítségével egy vagy több feltételezést megsértenek (azaz nem teljesülnek)., Ez nem ritka, ha valódi adatokkal dolgozik, nem pedig tankönyvi példákkal, amelyek gyakran csak azt mutatják meg, hogyan kell többszörös regressziót végrehajtani, amikor minden jól megy! Ne aggódjon azonban. Még akkor is, ha az adatok bizonyos feltételezéseket meghiúsulnak, gyakran van megoldás ennek leküzdésére. Először nézzük meg ezt a nyolc feltételezést:

1.feltételezés: a függő változót folyamatos skálán kell mérni (azaz intervallum vagy arányváltozó)., Az e kritériumnak megfelelő változók példái közé tartozik a felülvizsgálati idő (órákban mérve), az intelligencia (IQ pontszámmal mérve), a vizsga teljesítménye (0-tól 100-ig mérve), a súly (kg-ban mérve) stb. Az intervallum-és arányváltozókról bővebben a cikkünkben olvashat: Változótípusok. Ha a függő változót egy ordinális skálán mértük, akkor a többszörös regresszió helyett ordinális regressziót kell végrehajtania. Az ordinális változók példái közé tartoznak a Likert elemek (pl.,, egy 7 pontos skála a “határozottan egyetért” – tól a “határozottan nem ért egyet” – ig), többek között a kategóriák rangsorolásának módjai (például egy 3 pontos skála, amely elmagyarázza, hogy az ügyfél mennyire szerette a terméket, kezdve a “nem túl sok”-tól az “igen, sokat” – ig).
2. feltételezés: két vagy több Független változója van, amelyek lehetnek folytonosak (azaz intervallum-vagy arányváltozók) vagy kategorikusak (azaz ordinális vagy névleges változók). A folytonos és sorváltozók példáit lásd a fenti felsorolásban. A nominális változók példái közé tartozik a nem (pl. 2 csoport: férfi és nő), az etnikai hovatartozás (pl.,, 3 csoport: kaukázusi, afroamerikai és spanyol), fizikai aktivitás szintje (pl. 4 csoport: ülő, alacsony, mérsékelt és magas), szakma (pl. 5 csoport: sebész, orvos, nővér, fogorvos, terapeuta), stb. Ismét többet megtudhat a változókról a cikkünkben: változó típusok. Ha az egyik független változó dichotóm és moderáló változónak tekinthető, akkor lehet, hogy egy dichotóm moderátor elemzést kell futtatnia.
3. feltételezés :függetlennek kell lennie a megfigyelésektől (azaz,, a residuals függetlensége), amelyet könnyen ellenőrizhet a Durbin-Watson statisztika segítségével,amely egy egyszerű teszt az SPSS statisztikák használatával. Elmagyarázzuk, hogyan kell értelmezni a Durbin-Watson statisztika eredményét, valamint megmutatjuk a szükséges SPSS statisztikai eljárást a továbbfejlesztett többszörös regressziós útmutatóban.
4. feltételezés: lineáris összefüggésre van szükség a függő változó és az egyes független változók között, és (b) a függő változó és a független változók együttesen., Bár számos módja van, hogy ellenőrizze ezeket a lineáris kapcsolatok, javasoljuk, hogy hozzon létre scatterplots és részleges regressziós telkek segítségével SPSS statisztikák, majd vizuálisan ellenőrzi ezeket scatterplots és részleges regressziós telkek, hogy ellenőrizze a linearitás. Ha a scatterplotokban és a részleges regressziós parcellákban megjelenített kapcsolat nem lineáris, akkor nem lineáris regressziós analízist kell futtatnia, vagy “át kell alakítania” az adatait, amit az SPSS statisztikák segítségével tehet meg., A mi továbbfejlesztett többszörös regressziós útmutató, megmutatjuk, hogyan: (a) hozzon létre scatterplots és részleges regressziós telkek, hogy ellenőrizze a linearitás végrehajtása során több regresszió segítségével SPSS statisztika; (b) értelmezni a különböző scatterplot és részleges regressziós telek eredmények; és (c) átalakítani az adatokat SPSS statisztikák, ha nincs lineáris kapcsolatok között a változók.
5. feltételezés: az adatoknak homoscedasticitást kell mutatniuk,ahol a legjobb illeszkedési vonal mentén lévő eltérések hasonlóak maradnak a vonal mentén., A továbbfejlesztett többszörös regressziós útmutatónkban részletesebben ismertetjük, hogy ez mit jelent, és hogyan értékelhetjük adatainak homoscedasticitását. Amikor elemzi a saját adatait, meg kell ábrázolni a studentized maradványok ellen unstandardized jósolt értékeket. A továbbfejlesztett többszörös regressziós útmutatóban elmagyarázzuk: (a) Hogyan tesztelhetjük a homoscedasticitást az SPSS statisztikák segítségével; (b) néhány dolgot, amelyet figyelembe kell vennie az adatok értelmezésekor; és (c) az elemzés folytatásának lehetséges módjai, ha adatai nem felelnek meg ennek a feltételezésnek.,
6. feltételezés: az adatok nem mutathatnak multicollinearitást, ami akkor fordul elő, ha két vagy több független változó van, amelyek nagymértékben korrelálnak egymással. Ez problémákat okoz annak megértésében, hogy melyik független változó járul hozzá a függő változóban kifejtett varianciához, valamint a többszörös regressziós modell kiszámításának technikai kérdéseihez., Ezért a továbbfejlesztett többszörös regressziós útmutatóban megmutatjuk Önnek: (a) hogyan használjuk az SPSS statisztikákat a multicollinearitás kimutatására a korrelációs együtthatók és a tolerancia/VIF értékek ellenőrzése révén; és (b) hogyan értelmezzük ezeket a korrelációs együtthatókat és a tolerancia/VIF értékeket, hogy megállapíthassuk, hogy adatai megfelelnek-e vagy megsértik-e ezt a feltételezést.
7. feltételezés :nem lehetnek jelentős kiugrók, magas tőkeáttételi pontok vagy nagyon befolyásos pontok., A kiugró értékek, a tőkeáttétel és a befolyásos pontok különböző kifejezések, amelyeket arra használnak, hogy az adatkészletben olyan megfigyeléseket reprezentáljanak, amelyek valamilyen módon szokatlanok, ha többszörös regressziós elemzést kívánnak végezni. Ezek a szokatlan pontok különböző osztályozásai tükrözik a regressziós vonalra gyakorolt különböző hatásokat. A megfigyelés többféle szokatlan pontnak is minősíthető. Mindezek a pontok azonban nagyon negatív hatással lehetnek a regressziós egyenletre, amelyet a függő változó értékének a független változók alapján történő előrejelzésére használnak., Ez megváltoztathatja az SPSS statisztikák által generált kimenetet, valamint csökkentheti az eredmények prediktív pontosságát, valamint a statisztikai jelentőséget. Szerencsére, ha az SPSS statisztikákat több regresszió futtatására használja az adatain, akkor észlelheti a lehetséges kiugró értékeket, a magas tőkeáttételi pontokat és a rendkívül befolyásos pontokat., A továbbfejlesztett többszörös regressziós útmutató, akkor: (a) mutassa meg, hogyan kell felismerni a kívülállókat a “casewise diagnosztika”, illetve “studentized törölt maradványok”, amit tehetünk segítségével SPSS Statistics, megbeszélni néhány lehetőség van annak érdekében, hogy kezelni kiugró értéket; (b) ellenőrizze a tőkeáttétel pontok segítségével SPSS Statistics, hogy megbeszéljük, mit kell tennie, ha van; (c) ellenőrizze a befolyásos pontot SPSS Statisztikai segítségével intézkedés hatása ismert, mint Szakács Távolság, bemutatása előtt néhány gyakorlati megközelítések SPSS Statisztikai foglalkozni az olyan befolyásos pontot lehet.,
8. feltételezés: végül ellenőriznie kell, hogy a maradványok (hibák) általában eloszlanak-e (ezeket a kifejezéseket a továbbfejlesztett többszörös regressziós útmutatóban magyarázzuk). Ennek a feltételezésnek a ellenőrzésére két közös módszer van: a) hisztogram (egy egymásra helyezett normál görbével) és egy normál P-P telek; vagy b) A studentizált maradványok normál Q-Q parcellája., Ismét a továbbfejlesztett többszörös regressziós útmutatónkban: (a) megmutatjuk, hogyan ellenőrizhetjük ezt a feltételezést SPSS statisztikák segítségével, függetlenül attól, hogy hisztogramot (egymásra helyezett normál görbével) és normál P-P parcellát vagy normál Q-Q parcellát használ-e; (b) magyarázza el, hogyan kell értelmezni ezeket a diagramokat; és (c) adjon lehetséges megoldást, ha adatai nem felelnek meg ennek a feltételezésnek.

a feltételezéseket ellenőrizheti #3, #4, #5, #6, #7 és # 8 segítségével SPSS statisztikák. Az 1. és a 2. feltételezéseket először ellenőrizni kell, mielőtt feltételezésekre lépnének#3, #4, #5, #6, #7 és a 8., Ne feledje, hogy ha nem futtatja megfelelően a statisztikai teszteket ezeken a feltételezéseken, előfordulhat, hogy a többszörös regresszió futtatásakor kapott eredmények nem érvényesek. Ez az oka annak, hogy a továbbfejlesztett többszörös regressziós útmutatónk számos szakaszát szenteljük, hogy segítsünk Önnek ezt a jogot. A továbbfejlesztett tartalom egészéről a Funkcióinkról olvashat: Áttekintő oldal, vagy pontosabban, megtudhatja, hogyan segítünk a feltételezések tesztelésében a Szolgáltatásainkon: feltételezések oldal.,

a szakasz, eljárás, illusztráljuk az SPSS statisztikai eljárás elvégzésére többszörös regresszió feltételezve, hogy nem feltételezések megsértették. Először bemutatjuk az ebben az útmutatóban használt példát.

SPSS statisztika

példa

egy egészségügyi kutató azt akarja, hogy képes legyen megjósolni a “VO2max” – ot, amely a fitnesz és az egészség mutatója. Általában az eljárás végrehajtásához drága laboratóriumi felszerelésre van szükség, és szükségessé teszi, hogy az egyéni gyakorlat a lehető legnagyobb legyen (azaz amíg a fizikai kimerültség miatt tovább nem folytathatják a testmozgást)., Ez eltántoríthatja azokat az egyéneket, akik nem nagyon aktívak/fittek, valamint azokat az egyéneket, akiknek nagyobb a kockázata a rossz egészségi állapotnak (például idősebb, alkalmatlan alanyok). Ezen okok miatt, kívánatos volt, hogy megtalálja a módját, hogy előre az egyén VO2max alapuló attribútumok, hogy lehet mérni könnyebben és olcsóbban. Ebből a célból egy kutató 100 résztvevőt toborzott a maximális VO2max teszt elvégzésére, de rögzítette “életkorukat”, “súlyukat”, “pulzusszámukat” és “nemüket”is. A pulzusszám az elmúlt 5 perc átlaga 20 perc, sokkal könnyebb, alacsonyabb munkaterhelés kerékpáros teszt., A kutató célja, hogy képes legyen megjósolni VO2max e négy tulajdonság alapján: életkor, súly, pulzusszám és nem.

SPSS Statistics

Beállítás az SPSS Statistics

Az SPSS Statisztikai hoztuk létre hat változók: (1) VO2max, amely a maximális aerob kapacitás; (2) a korban, amely a résztvevő kor; (3) tömeg, amely a résztvevő tömeg (technikailag ez a “tömeg”); (4) heart_rate, amely a résztvevő pulzusszám; (5) nemek, ami a résztvevő a nemek közötti; valamint (6) caseno, amely az ügy számát., A caseno változót arra használják, hogy megkönnyítse az Ön számára a feltételezések ellenőrzésekor azonosított esetek (például “jelentős kiugró értékek”, “magas tőkeáttételi pontok” és “rendkívül befolyásos pontok”) kiküszöbölését. A továbbfejlesztett többszörös regressziós útmutatóban megmutatjuk, hogyan kell helyesen beírni az adatokat az SPSS statisztikákba többszörös regresszió futtatásához, amikor feltételezéseket is ellenőriz. A továbbfejlesztett adatbeállítási tartalomról a következő Szolgáltatásainkon tudhat meg: Adatbeállítási oldal. Alternatív megoldásként tekintse meg általános,” Gyorsindítás ” útmutatónkat: adatok bevitele az SPSS statisztikákba.,

SPSS statisztika

vizsgálati eljárás az SPSS statisztikákban

az alábbi hét lépés megmutatja, hogyan kell elemezni adatait az SPSS statisztikákban többszörös regresszió alkalmazásával, ha az előző szakaszban szereplő nyolc feltételezés egyikét sem sértették meg, feltételezések. E hét lépés végén megmutatjuk, hogyan kell értelmezni a többszörös regresszió eredményeit., Ha segítséget keres, hogy megbizonyosodjon arról, hogy adatai megfelelnek-e a feltételezéseknek #3, #4, #5, #6, #7 és #8, amelyek szükségesek, ha több regresszió, és lehet tesztelni az SPSS statisztikák, akkor többet megtudni a mi továbbfejlesztett útmutató(lásd a funkciók: áttekintés oldal többet megtudni).

Click Analyse> regresszió> lineáris… a főmenüben, az alábbiak szerint:

megjelent írásbeli engedélyével SPSS statisztika, IBM Corporation.,

Megjegyzés: Ne aggódjon, hogy az Analyze > regresszió > lineáris… a főmenüben, vagy hogy a párbeszédpanelek a következő lépésekben a cím, lineáris regresszió. Nem hibáztál. Ön a megfelelő helyen, hogy végezze el a többszörös regressziós eljárás. Ez csak a cím, amelyet az SPSS statisztikák adnak, még többszörös regressziós eljárás futtatásakor is.,
az alábbi lineáris regressziós párbeszédpanel jelenik meg:

az SPSS Statistics, IBM Corporation írásbeli engedélyével.,
át a függő változó, VO2max, a Függő: mezőbe, a független változók, kor, súly, heart_rate, valamint a nemek közötti a Független(ok): doboz, használja a gombok, amint azt az alábbiakban (az összes többi doboz lehet figyelmen kívül hagyni):

Megjelent írásos engedélye SPSS Statistics, IBM Corporation.,

megjegyzés: egy szabványos többszörös regresszió esetén figyelmen kívül kell hagyni a és gombokat, mivel azok szekvenciális (hierarchikus) többszörös regresszióhoz tartoznak. A metódus: opciót az alapértelmezett értéken kell tartani, ami . Ha bármilyen okból a nincs kiválasztva, meg kell változtatnia a módszert: vissza. A módszer az SPSS statisztikák által a standard regressziós elemzéshez megadott név.,
kattintson a gombra. A Linear Regression: Statistics párbeszédpanelt az alábbiakban mutatjuk be:

megjelent az SPSS Statistics, IBM Corporation írásbeli engedélyével.
az alapértelmezés szerint kiválasztott opciókon kívül válassza ki a konfidencia intervallumokat a-regressziós együtthatók területén, így a szint(%): opció a “95” – nél., A következő képernyő jelenik meg:

megjelent az SPSS Statistics, IBM Corporation írásbeli engedélyével.
kattintson a gombra. Akkor vissza a lineáris regressziós párbeszédablak.
kattintson a gombra. Ez generálja a kimenetet.

többszörös regressziós analízis SPSS statisztikák segítségével

Bevezetés

SPSS statisztika

feltételezések

SPSS statisztika

példa

SPSS Statistics

Beállítás az SPSS Statistics

SPSS statisztika

vizsgálati eljárás az SPSS statisztikákban

Vélemény, hozzászólás? Kilépés a válaszból