Zobacz też Pearson Correlations – szybkie wprowadzenie.
- Test korelacji – co to jest?
- hipoteza zerowa
- założenia
- Test korelacji w SPSS
- raportowanie
Test korelacji – co to jest?
a (Pearson) korelacja jest liczbą od -1 do +1, która wskazuje, w jakim stopniu 2 zmienne ilościowe są powiązane liniowo. Najlepiej to zrozumieć, patrząc na jakieś rozrzuty.,
w skrócie
- korelacja -1 oznacza idealną relację liniową malejącą: wyższe wyniki dla jednej zmiennej oznaczają niższe wyniki dla drugiej zmiennej.
- korelacja 0 oznacza, że nie ma żadnej zależności liniowej między 2 zmiennymi. Niemniej jednak może istnieć (silna) relacja nieliniowa.
- korelacja 1 wskazuje na doskonałą rosnącą zależność liniową: wyższe wyniki dla jednej zmiennej są związane z wyższymi wynikami dla drugiej zmiennej.,
hipoteza zerowa
test korelacji (Zwykle) testuje hipotezę zerową, że korelacja populacji wynosi zero.Dane często zawierają tylko próbkę z (znacznie) większej populacji: badałem 100 klientów (próbka), ale naprawdę jestem zainteresowany wszystkimi moimi 100 000 klientów (populacja). Wyniki próby zazwyczaj różnią się nieco od wyników populacji. Więc znalezienie niezerowej korelacji w mojej próbie nie dowodzi, że zmienne 2 są skorelowane w całej mojej populacji; jeśli korelacja populacji jest naprawdę zero, mogę łatwo znaleźć małą korelację w mojej próbie., Jednak znalezienie silnej korelacji w tym przypadku jest bardzo mało prawdopodobne i sugeruje, że moja korelacja populacyjna nie była jednak zerowa.
Test korelacji – założenia
samo obliczanie i interpretacja współczynników korelacji nie wymaga żadnych założeń. Jednak statystyczna istotność-test korelacji zakłada
- niezależne obserwacje;
- normalność: nasze 2 zmienne muszą podążać dwuwarstwowym rozkładem normalnym w naszej populacji. Założenie to nie jest potrzebne dla próbek o wielkości N = 25 lub większej.,Dla rozsądnych rozmiarów próbek, centralne twierdzenie graniczne zapewnia, że rozkład próbkowania będzie normalny.
SPSS – szybkie sprawdzanie danych
przeprowadźmy teraz kilka testów korelacji w SPSS. Użyjemy nastolatków.sav, plik danych, który zawiera dane testów psychologicznych na 128 dzieci w wieku od 12 do 14 lat. Część jego widoku zmiennego jest pokazana poniżej.
teraz, zanim uruchomimy jakiekolwiek korelacje, najpierw upewnijmy się, że nasze dane są wiarygodne., Ponieważ wszystkie 5 zmiennych jest metrycznych, szybko sprawdzimy ich histogramy, uruchamiając poniższą składnię.
częstotliwość iq do wellb
/format
/ histogram.
wynik histogramu
nasze histogramy mówią nam wiele: Nasze zmienne mają od 5 do 10 brakujących wartości. Ich środki są blisko 100 z odchyleniami standardowymi około 15 – co jest dobre, ponieważ w ten sposób te testy zostały skalibrowane. Jedno mnie martwi, a to jest pokazane poniżej.,
wydaje się, że ktoś zaliczył zero w niektórych testach-co wcale nie jest wiarygodne. Jeśli to zignorujemy, nasze korelacje będą mocno stronnicze. Posortujmy nasze sprawy, zobaczmy, co się dzieje i ustawmy brakujące wartości, zanim przejdziemy dalej.
Sortuj przypadki według iq.
* jeden przypadek ma zero w obu testach. Ustaw jako brakującą wartość przed kontynuowaniem.
brakujące wartości iq (0).
Jeśli teraz odtworzymy nasze histogramy, zobaczymy, że wszystkie dystrybucje wyglądają wiarygodnie., Dopiero teraz powinniśmy zacząć sprawdzać rzeczywiste korelacje.
Uruchamianie testu korelacji w SPSS
najpierw przejdźmy do analizy skoreluj Dwuargument jak pokazano poniżej.
Przenieś wszystkie istotne zmienne do pola zmienne. Pewnie nie chcesz tu niczego zmieniać.
kliknij Wklej wyniki w poniższej składni. Zróbmy to.
składnia korelacji SPSS
korelacje
/zmienne=IQ
/druk=TWOOTAIL NOSIG
/ brak=PAIRWISE.
*krótsza wersja, tworzy dokładnie to samo wyjście.
korelacje iq z wellb
/Drukuj nosig.
wyjście korelacji
domyślnie SPSS zawsze tworzy pełną macierz korelacji. Każda korelacja pojawia się dwa razy: powyżej i poniżej głównej przekątnej. Korelacje na głównej przekątnej są korelacjami między każdą zmienną a nią samą -dlatego wszystkie są 1 i wcale nie są interesujące. 10 korelacji poniżej przekątnej jest tym, czego potrzebujemy., Z reguły korelacja jest statystycznie istotna, jeśli jej ” Sig. (2-tailed) „< 0.05.Teraz przyjrzyjmy się naszym wynikom: najsilniejsza korelacja jest między depresją a ogólnym samopoczuciem : r = -0,801. Opiera się na N = 117 dzieciach i jego 2-krotnym znaczeniu, p = 0,000. Oznacza to, że istnieje 0.000 prawdopodobieństwo znalezienia tej korelacji próbki – lub większy – jeśli rzeczywista korelacja populacji wynosi zero.
zauważ, że IQ nie koreluje z niczym. Jego najsilniejsza korelacja to 0,152 z lęgiem, ale p = 0.,11 więc statystycznie nie różni się znacząco od zera. Oznacza to, że istnieje 0,11 szansa na znalezienie go, jeśli korelacja populacji jest zerowa. Korelacja ta jest zbyt mała, aby odrzucić hipotezę zerową.
podobnie, nasze 10 korelacji wskazuje, w jakim stopniu każda para zmiennych jest powiązana liniowo. Na koniec należy zauważyć, że każda korelacja jest obliczana na nieco innym N-w zakresie od 111 do 117. Dzieje się tak dlatego, że SPSS domyślnie używa parowego usuwania brakujących wartości dla korelacji.,
Scatterplots
ściśle, powinniśmy sprawdzić wszystkie scatterplots wśród naszych zmiennych, jak również. W końcu zmienne, które nie korelują, mogą być nadal powiązane w jakiś nieliniowy sposób. Ale dla więcej niż 5 lub 6 zmiennych, liczba możliwych punktów rozpraszania eksploduje, więc często pomijamy ich kontrolę. Zobacz jednak SPSS-Create All Scatterplots Tool.
poniższa składnia tworzy tylko jeden scatterplot, aby zorientować się, jak wygląda nasza relacja. Wynik nie pokazuje jednak niczego nieoczekiwanego.
graph
/ scatter wellb with depr
/subtitle „Correlation = – 0.8 / N = 128”.
raportowanie testu korelacji
poniższy rysunek przedstawia najbardziej podstawowy format zalecany przez APA do raportowania korelacji. Co ważne, upewnij się, że tabela wskazuje, które korelacje są istotne statystycznie przy p < 0.05 i być może p < 0.01. Zobacz też korelacje SPSS w formacie APA.
Jeśli to możliwe, zgłoś przedziały ufności również dla swoich korelacji., Co dziwne, SPSS nie obejmuje tych. Jednak patrz SPSS przedziały ufności dla narzędzia korelacji.
dzięki za przeczytanie!
Dodaj komentarz