Vícenásobné Regresní Analýzy pomocí SPSS Statistics

posted in: Articles | 0

Úvod

Vícenásobné regrese je rozšíření jednoduché lineární regrese. Používá se, když chceme předpovědět hodnotu proměnné na základě hodnoty dvou nebo více dalších proměnných. Proměnná, kterou chceme předvídat, se nazývá závislá proměnná (nebo někdy proměnná výsledku, cíle nebo kritéria)., Proměnné, které používáme předpovědět hodnotu závislé proměnné se nazývají nezávislé proměnné (nebo někdy, prediktor, vysvětlující nebo regressor proměnných).

například byste mohli použít vícenásobnou regresi, abyste pochopili, zda lze výkon zkoušky předvídat na základě doby revize, zkušební úzkosti, účasti na přednášce a pohlaví. Alternativně byste mohli použít vícenásobnou regresi, abyste pochopili, zda lze denní spotřebu cigaret předvídat na základě doby kouření, věku, kdy začalo kouřit, typu kuřáka, příjmu a pohlaví.,

Vícenásobné regrese také umožňuje určit celkový fit (rozptyl vysvětlil) modelu a relativní příspěvek každého z prediktory celkového rozptylu bylo vysvětleno. Například, možná budete chtít vědět, kolik variace v zkoušky výkonnosti lze vysvětlit tím, že čas revize, test úzkost, přednáška účast a rovnost „jako celek“, ale také „relativní příspěvek“ každé nezávislé proměnné na vysvětlující rozptyl.,

tato příručka „rychlý start“ vám ukáže, jak provádět vícenásobnou regresi pomocí statistik SPSS, stejně jako interpretovat a hlásit výsledky z tohoto testu. Než vás však seznámíme s tímto postupem, musíte pochopit různé předpoklady, které musí vaše data splňovat, aby vám vícenásobná regrese poskytla platný výsledek. O těchto předpokladech budeme diskutovat dále.,

SPSS Statistics

Předpoklady

Pokud se rozhodnete analyzovat data pomocí vícenásobné regrese, která je součástí procesu zahrnuje kontrolu, aby se ujistil, že data, která chcete analyzovat, můžete ve skutečnosti být analyzovány pomocí vícenásobné regrese. Musíte to udělat, protože to je vhodné pouze k použití vícenásobné regrese, pokud vaše data „projde“ osm předpokladů, které jsou nutné pro vícenásobné regrese, aby vám platný výsledek., V praxi, kontrola těchto osmi předpokladů, jen přidává trochu více času na vaše analýzy, které vyžadují, abyste klepněte na tlačítko pár tlačítek v SPSS Statistics při provádění své analýzy, stejně jako si myslím, že trochu více o vaše data, ale to není obtížný úkol.

než vás seznámíme s těmito osmi předpoklady, nebuďte překvapeni, pokud při analýze vlastních údajů pomocí statistik SPSS dojde k porušení jednoho nebo více těchto předpokladů (tj., To není neobvyklé při práci s daty v reálném světě spíše než příklady učebnic, které vám často ukazují, jak provádět vícenásobnou regresi, když vše půjde dobře! Nicméně, nebojte se. I když vaše data selže určité předpoklady, často existuje řešení, jak to překonat. Nejprve se podívejme na těchto osm předpokladů:

  • předpoklad #1: Vaše závislá proměnná by měla být měřena na kontinuální stupnici (tj., Příklady proměnných, které splňují tato kritéria zahrnují revize času (měřeno v hodinách), inteligence (měří pomocí IQ skóre), zkouška výkonu (měřeno od 0 do 100), hmotnosti (vyjádřené v kg), a tak dále. Další informace o proměnných intervalů a poměrů naleznete v našem článku: Typy proměnných. Pokud byla vaše závislá proměnná měřena na pořadové stupnici, budete muset provést ordinální regresi spíše než vícenásobnou regresi. Příklady pořadových proměnných zahrnují položky Likert (např.,, 7-bodové škále od „rozhodně souhlasím“ až po „silně nesouhlasím“), mezi další způsoby, pořadí kategorií (např., 3-bodové stupnici vysvětlovat, jak moc se zákazník rád produkt, od „moc Ne“ na „Ano, hodně“).
  • předpoklad #2: máte dvě nebo více nezávislých proměnných, které mohou být buď spojité(tj. Příklady spojitých a pořadových proměnných viz výše uvedená kulka. Mezi příklady nominálních proměnných patří pohlaví (např. 2 skupiny: muž a žena), etnicita (např.,, 3 skupin: Běloch, Africký Američan a Hispánské), úroveň fyzické aktivity (např. na 4 skupiny: sedavé, nízké, střední a vysoké), profese (např., 5 skupin: chirurg, lékař, zdravotní sestra, zubní lékař, terapeut), a tak dále. Opět se můžete dozvědět více o proměnných v našem článku: Typy proměnných. Pokud se jeden z vašich nezávislé proměnné jsou dichotomické a za moderování variabilní, možná budete muset spustit Dichotomické moderátor analýzy.
  • předpoklad #3: měli byste mít nezávislost pozorování (tj.,, nezávislost reziduí), které můžete snadno zkontrolovat pomocí statistiky Durbin-Watson, což je jednoduchý test, který lze spustit pomocí statistik SPSS. Vysvětlíme, jak interpretovat výsledek Durbin-Watson statistika, stejně jako zobrazující SPSS Statistics postup vyžaduje, v naší rozšířené vícenásobné regrese průvodce.
  • předpoklad #4: musí existovat lineární vztah mezi (a) závislou proměnnou a každou z vašich nezávislých proměnných a (b) závislou proměnnou a nezávislými proměnnými kolektivně., Zatímco existuje řada způsobů, jak chcete-li zkontrolovat tyto lineární vztahy, doporučujeme vytvoření scatterplots a parciální regresní grafy pomocí SPSS Statistics, a pak vizuálně kontrole těchto scatterplots a parciální regresní grafy pro kontrolu linearity. Pokud vztah zobrazeny v scatterplots a parciální regresní grafy nejsou lineární, budete muset buď spustit non-lineární regresní analýzy nebo „proměnit“ vaše data, které můžete udělat pomocí SPSS Statistics., V naší rozšířené vícenásobné regrese příručce, vám ukážeme, jak na to: (a) vytvořit scatterplots a parciální regresní grafy pro kontrolu linearity při provádění vícenásobné regrese pomocí SPSS Statistics; (b) interpretovat různé scatterplot a parciální regresní graf výsledků; a (c) transformace dat pomocí SPSS Statistics pokud nemáte lineární vztahy mezi proměnnými.
  • Předpoklad #5: Vaše data musí ukázat, homoskedasticity, které je místo, kde rozptylů podél linie nejlépe hodí zůstávají podobné, jak budete pohybovat podél čáry., Vysvětlíme více o tom, co to znamená, a jak k posouzení homoskedasticity dat v naší rozšířené vícenásobné regrese průvodce. Když analyzujete vlastní data, budete muset vykreslit studentské rezidua proti nestandardizovaným předpokládaným hodnotám. V naší rozšířené vícenásobné regrese průvodce, jsme se vysvětlit: (a), jak k testování homoskedasticity pomocí SPSS Statistics; (b) některé z věcí, které budete muset zvážit při interpretaci dat; a (c) možné způsoby, jak pokračovat s vaší analýzou dat nesplňuje tento předpoklad.,
  • předpoklad #6: Vaše data nesmí vykazovat multicollinearitu, ke které dochází, když máte dvě nebo více nezávislých proměnných, které jsou navzájem vysoce korelovány. To vede k problémům s pochopením, které nezávisle proměnná přispívá k rozptylu je vysvětleno v závislé proměnné, stejně jako technické problémy při výpočtu vícenásobné regresní model., Proto v naší rozšířené vícenásobné regrese příručce, budeme vám ukázat: (a) jak používat SPSS Statistics pro detekci pro multikolinearita prostřednictvím inspekce korelační koeficienty a Tolerance/VIF hodnoty; a (b) jak interpretovat tyto korelační koeficienty a Tolerance/VIF hodnoty, takže si můžete určit, zda vaše data splňuje nebo porušuje tento předpoklad.
  • předpoklad #7: neměly by existovat žádné významné odlehlé hodnoty, vysoké pákové body nebo vysoce vlivné body., Odlehlé hodnoty, pákový efekt a vlivné body jsou různé pojmy používané k reprezentaci pozorování ve vaší datové sadě, které jsou nějakým způsobem neobvyklé, když chcete provést vícenásobnou regresní analýzu. Tyto různé klasifikace neobvyklých bodů odrážejí rozdílný dopad, který mají na regresní linii. Pozorování lze klasifikovat jako více než jeden typ neobvyklého bodu. Všechny tyto body však mohou mít velmi negativní vliv na regresní rovnici, která se používá k předpovědi hodnoty závislé proměnné na základě nezávislých proměnných., To může změnit výstup, který produkuje statistika SPSS, a snížit prediktivní přesnost vašich výsledků a statistickou významnost. Naštěstí při použití statistik SPSS ke spuštění vícenásobné regrese na vašich datech můžete detekovat možné odlehlé hodnoty, vysoké pákové body a vysoce vlivné body., V naší rozšířené vícenásobné regrese průvodce, jsme se: (a) ukázat vám, jak k detekci odlehlých hodnot pomocí „casewise diagnostics“ a „studentized odstraněny zbytky“, které můžete udělat pomocí SPSS Statistics, a diskutovat o některé z možností, které máte, aby se vypořádat s odlehlé hodnoty; (b) zkontrolujte, zda páka bodů pomocí SPSS Statistics a diskutovat o tom, co byste měli udělat, pokud máte nějaké; a (c) zkontrolujte, zda vlivných bodů v SPSS Statistics pomocí měření vlivu známý jako cookova Vzdálenost, před předložením některé praktické přístupy v SPSS Statistiky k řešení jakýchkoli vlivných bodů, které můžete mít.,
  • předpoklad #8: nakonec musíte zkontrolovat, zda jsou zbytky (chyby) přibližně normálně distribuovány (vysvětlíme tyto pojmy v našem rozšířeném průvodci vícenásobnou regresí). Dvě běžné metody pro kontrolu tohoto předpokladu zahrnují použití: (a) histogramu (se superponovanou normální křivkou) a normálního P-P grafu; nebo (b) normálního Q-Q grafu studovaných reziduí., Opět platí, že v naší vylepšenou vícenásobné regrese průvodce, jsme se: (a) ukázat vám, jak ke kontrole tohoto předpokladu pomocí SPSS Statistics, zda používáte histogram (s položený normální křivky) a Normální P-P Plot, nebo Normální Q-Q graf; (b) vysvětlit, jak interpretovat tyto diagramy; a (c) poskytnout možné řešení, pokud vaše data nesplňuje tento předpoklad.

můžete zkontrolovat předpoklady #3, #4, #5, #6, #7 a # 8 pomocí statistik SPSS. Předpoklady #1 a #2 je třeba nejprve zkontrolovat, než se přesunete na předpoklady #3, #4, #5, #6, #7 a #8., Nezapomeňte, že pokud neprovedete statistické testy na těchto předpokladech správně, výsledky, které získáte při spuštění vícenásobné regrese, nemusí být platné. To je důvod, proč věnujeme řadu sekcí našeho rozšířeného vícenásobného regresního průvodce, který vám pomůže získat toto právo. O našem vylepšeném obsahu jako celku se můžete dozvědět na našich funkcích: přehledová stránka, nebo konkrétněji, zjistěte, jak pomáháme s testovacími předpoklady o našich funkcích: stránka předpokladů.,

V sekci, Postup, jsme ilustraci SPSS Statistics postup provést vícenásobné regrese za předpokladu, že žádné předpoklady byly porušeny. Nejprve představíme příklad, který se používá v této příručce.

SPSS Statistics

Příklad:

zdraví výzkumník chce být schopen předpovědět, „VO2max“, ukazatelem kondice a zdraví. Normálně, k provedení tohoto postupu vyžaduje nákladné laboratorní zařízení a vyžaduje, aby jednotlivec cvičení na maximum (tj. dokud se může nadále vykonávat z důvodu fyzického vyčerpání)., To může odradit ty jednotlivce, kteří nejsou příliš aktivní / fit, a ty jednotlivce, kteří by mohli být vystaveni vyššímu riziku špatného zdraví (např. Z těchto důvodů bylo žádoucí najít způsob, jak předpovídat VO2max jednotlivce na základě atributů, které lze měřit snadněji a levněji. Za tímto účelem výzkumný pracovník přijal 100 účastníků k provedení maximálního testu VO2max, ale také zaznamenal jejich „věk“, „váhu“, „srdeční frekvenci“ a „pohlaví“. Srdeční frekvence je průměr posledních 5 minut 20 minut, mnohem jednodušší, nižší zátěžový cyklistický test., Cílem výzkumníka je předvídat VO2max na základě těchto čtyř atributů: věk, hmotnost, srdeční frekvence a pohlaví.

SPSS Statistics

Nastavení v SPSS Statistics

V programu SPSS Statistics, jsme vytvořili šest proměnných: (1) VO2max, což je maximální aerobní kapacity; (2) věk, který je účastníkem věku; (3) hmotnost, což je na účastníka hmotnost (technicky, to je jejich „hmotnost“); (4) heart_rate, který je účastníkem je srdeční frekvence; (5) pohlaví, což je účastník pohlaví; a (6) caseno, což je případ číslo., Proměnná caseno se používá k usnadnění eliminace případů (např. „významné odlehlé hodnoty“, „vysoké pákové body“ a „vysoce vlivné body“), které jste identifikovali při kontrole předpokladů. V naší rozšířené vícenásobné regrese příručce, vám ukážeme, jak správně zadávat data do SPSS Statistics spustit vícenásobné regrese, kdy jste také kontrola předpokladů. O našem vylepšeném obsahu nastavení dat se můžete dozvědět na naší stránce Funkce: nastavení dat. Alternativně viz náš obecný průvodce „rychlý start“: zadávání dat do statistik SPSS.,

SPSS Statistics

Postup Testu v SPSS Statistics

Na sedm kroků níže vám ukázat, jak analyzovat data pomocí vícenásobné regrese v SPSS Statistics, kdy žádný z osmi předpokladů v předchozí části, Předpoklady, byly porušeny. Na konci těchto sedmi kroků vám ukážeme, jak interpretovat výsledky z vaší vícenásobné regrese., Pokud hledáte pomoc, aby se ujistěte se, že vaše data splňují předpoklady #3, #4, #5, #6, #7 a #8, které jsou nutné při použití vícenásobné regrese a mohou být testovány pomocí SPSS Statistics, se můžete dozvědět více v naší rozšířené příručce (viz naše Funkce: Přehled stránky se dozvíte více).

  1. klikněte na analyzovat >regrese> Lineární… v hlavním menu, jak je uvedeno níže:

    Zveřejněno s písemným souhlasem SPSS Statistics, IBM Corporation.,

    Poznámka: nebojte se, že jste výběru Analyzovat > Regrese > Lineární… v hlavní nabídce nebo že dialogová okna v následujících krocích mají název, lineární regrese. Neudělal jsi chybu. Jste na správném místě, abyste provedli postup vícenásobné regrese. To je jen název, který SPSS statistiky dává, a to i při spuštění více regresní postup.,

  2. bude Vám prezentovány s Lineární Regresní dialog box níže:

    Zveřejněno s písemným souhlasem SPSS Statistics, IBM Corporation.,

  3. Převod na závislé proměnné, VO2max, do Závislá: box a nezávislé proměnné, je věk, hmotnost, heart_rate a pohlaví do Nezávislé(s): pole, pomocí tlačítka, jak je znázorněno níže (všechny ostatní boxy mohou být ignorovány):

    Zveřejněno s písemným souhlasem SPSS Statistics, IBM Corporation.,

    Poznámka: Pro standardní vícenásobné regrese byste měli ignorovat tlačítka tak, jak jsou pro sekvenční (hierarchické) vícenásobné regrese. Metoda: volba musí být ponechána na výchozí hodnotě, která je . Pokud z jakéhokoli důvodu není vybrána , musíte změnit metodu: zpět na . Metoda je název daný statistikami SPSS pro standardní regresní analýzu.,

  4. klikněte na tlačítko . Ty budou prezentovány s Lineární Regrese: Statistiky dialog box, jak je uvedeno níže:

    Zveřejněno s písemným souhlasem SPSS Statistics, IBM Corporation.

  5. kromě možností, které jsou ve výchozím nastavení vybrány, Vyberte intervaly spolehlivosti v oblasti-regresní koeficienty-opouštějící úroveň (%): možnost na „95“., Skončí s následující obrazovka:

    Zveřejněno s písemným souhlasem SPSS Statistics, IBM Corporation.

  6. klikněte na tlačítko . Budete vráceni do dialogového okna lineární regrese.
  7. klikněte na tlačítko . Tím se vygeneruje výstup.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *