SPSS Correlation Analysis Tutorial

geplaatst in: Articles | 0

zie ook Pearson correlaties-Quick Introduction.

  • Correlatietest – Wat Is het?
  • nulhypothese
  • aannames
  • Correlatietest in SPSS
  • rapportage

Correlatietest – Wat Is het?

een (Pearson) correlatie is een getal tussen -1 en +1 dat aangeeft in welke mate 2 kwantitatieve variabelen lineair gerelateerd zijn. Het is het beste te begrijpen door te kijken naar sommige scatterplots.,

kortom,

  • een correlatie van -1 geeft een perfecte lineaire aflopende relatie aan: hogere scores op de ene variabele impliceren lagere scores op de andere variabele.
  • een correlatie van 0 betekent dat er geen lineaire relatie is tussen 2 variabelen. Er kan echter een (sterke) niet-lineaire relatie zijn.
  • een correlatie van 1 geeft een perfecte oplopende lineaire relatie aan: hogere scores op de ene variabele worden geassocieerd met hogere scores op de andere variabele.,

nulhypothese

een correlatietest test (meestal) de nulhypothese dat de populatiecorrelatie nul is.Gegevens bevatten vaak slechts een steekproef van een (veel) grotere populatie: ik ondervroeg 100 klanten (steekproef) maar ik ben echt geïnteresseerd in al mijn 100.000 klanten (populatie). De resultaten van de steekproef verschillen typisch enigszins van de resultaten van de bevolking. Dus het vinden van een niet-nul correlatie in mijn steekproef bewijst niet dat 2 variabelen zijn gecorreleerd in mijn gehele populatie; als de populatie correlatie is echt nul, kan ik gemakkelijk een kleine correlatie in mijn steekproef vinden., Echter, het vinden van een sterke correlatie in dit geval is zeer onwaarschijnlijk en suggereert dat mijn populatie correlatie was toch niet nul.

Correlatietest-aannames

Het berekenen en interpreteren van correlatiecoëfficiënten zelf vereist geen aannames. Echter, de statistische significantie-test voor correlaties veronderstelt

  • onafhankelijke waarnemingen;
  • normaliteit: onze 2 variabelen moeten een bivariate normale verdeling in onze populatie volgen. Deze aanname is niet nodig voor steekproefgrootten van n = 25 of meer.,Voor redelijke steekproefgroottes zorgt de centrale limietstelling ervoor dat de samplingdistributie normaal zal zijn.

SPSS – snelle gegevenscontrole

laten we nu enkele correlatietests in SPSS uitvoeren. We gebruiken adolescenten.sav, een gegevensbestand dat psychologische testgegevens bevat van 128 kinderen tussen 12 en 14 jaar oud. Een deel van de variabele weergave wordt hieronder getoond.

laten we nu, voordat we enige correlaties uitvoeren, eerst controleren of onze gegevens plausibel zijn., Aangezien alle 5 variabelen metrisch zijn, zullen we snel hun histogrammen inspecteren door de syntaxis hieronder uit te voeren.

*snelle gegevenscontrole: histogrammen over alle relevante variabelen.
frequenties IQ naar wellb
/ format notable
/ histogram.

Histogram Output

onze histogrammen vertellen ons veel: onze variabelen hebben tussen de 5 en 10 ontbrekende waarden. Hun middelen zijn in de buurt van 100 met standaarddeviaties rond 15-wat goed is, want dat is hoe deze tests zijn gekalibreerd. Een ding stoort me, hoewel, en het is hieronder weergegeven.,

Het lijkt erop dat iemand nul scoorde op sommige tests-wat helemaal niet aannemelijk is. Als we dit negeren, zullen onze correlaties ernstig bevooroordeeld zijn. Laten we onze zaken Sorteren, kijken wat er aan de hand is en een aantal ontbrekende waarden instellen voordat we verder gaan.

*inspecteer case met lage IQ / anxi scores.
Sorteer gevallen op iq.
* Een geval heeft nul bij beide tests. Stel als ontbrekende waarde in voordat u verder gaat.
ontbrekende waarden iq anxi (0).

als we nu onze histogrammen opnieuw uitvoeren, zullen we zien dat alle distributies plausibel lijken., Pas nu moeten we overgaan tot het uitvoeren van de werkelijke correlaties.

een Correlatietest uitvoeren in SPSS

laten we eerst navigeer naar Analyse correleren Bivariate zoals hieronder getoond.

Verplaats alle relevante variabelen naar het vak variabelen. Je wilt hier waarschijnlijk niets anders veranderen.

klikken op Plakken resulteert in onderstaande syntaxis. Laten we het natrekken.

SPSS-correlaties syntaxis

* correlaties zoals geplakt in het menu.,
correlaties
/ VARIABLES = iq depr anxi soci wellb
/ PRINT = TWOTAIL NOSIG
/ MISSING = paarsgewijs.
*kortere versie, maakt exact dezelfde uitvoer.
correlaties iq met wellb
/ print nosig.

Correlatieuitvoer

standaard maakt SPSS altijd een volledige correlatiematrix aan. Elke correlatie verschijnt tweemaal: boven en onder de hoofddiagonaal. De correlaties op de hoofddiagonaal zijn de correlaties tussen elke variabele en zichzelf-daarom zijn ze allemaal 1 en helemaal niet interessant. De 10 correlaties onder de diagonaal zijn wat we nodig hebben., Als vuistregel is een correlatie statistisch significant als zijn ” Sig. (2-tailed)”< 0,05.Laten we nu eens goed kijken naar onze resultaten: de sterkste correlatie is tussen depressie en algemeen welzijn : r = -0.801. Het is gebaseerd op n = 117 kinderen en zijn 2-tailed betekenis, p = 0.000. Dit betekent dat er een 0.000 kans op het vinden van deze steekproef correlatie-of een grotere – als de werkelijke populatie correlatie is nul.
merk op dat IQ niet correleert met iets. Zijn sterkste correlatie is 0,152 met angst maar p = 0.,11 dus het is niet statistisch significant verschillend van nul. Dat wil zeggen, er is een 0.11 kans om het te vinden als de populatie correlatie nul is. Deze correlatie is te klein om de nulhypothese te verwerpen.op deze manier geven onze 10 correlaties aan in welke mate elk paar variabelen lineair gerelateerd is. Tot slot, merk op dat elke correlatie wordt berekend op een iets andere N-variërend van 111 tot 117. Dit komt omdat SPSS standaard gebruik maakt van paarsgewijze verwijdering van ontbrekende waarden voor correlaties.,

Scatterplots

strikt genomen moeten we alle scatterplots onder onze variabelen ook inspecteren. Immers, variabelen die niet correleren kunnen nog steeds worden gerelateerd op een of andere niet-lineaire manier. Maar voor meer dan 5 of 6 variabelen explodeert het aantal mogelijke scatterplots, zodat we vaak de inspectie ervan overslaan. Echter, zie SPSS-Create All Scatterplots Tool.
De syntaxis hieronder creëert slechts één scatterplot, alleen maar om een idee te krijgen van hoe onze relatie eruit ziet. Het resultaat laat echter niets onverwachts zien.

* eenvoudige scatterplot voor welzijn door depressie.,
grafiek
/ verstrooiingsbron met depr
/ ondertitel “correlatie = – 0.8 / N = 128”.

rapportage van een Correlatietest

onderstaande figuur toont het meest basale formaat dat door de APA wordt aanbevolen voor het rapporteren van correlaties. Belangrijk is dat de tabel aangeeft welke correlaties statistisch significant zijn bij p < 0,05 en misschien p < 0,01. Zie ook SPSS correlaties in APA formaat.

indien mogelijk, rapporteer ook de betrouwbaarheidsintervallen voor uw correlaties., Vreemd genoeg omvat SPSS die niet. Zie echter SPSS betrouwbaarheidsintervallen voor correlaties Tool.

Bedankt voor het lezen!

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *