el análisis de regresión múltiple utilizando SPSS Statistics

publicado en: Articles | 0

Introducción

la regresión múltiple es una extensión de la regresión lineal simple. Se utiliza cuando queremos predecir el valor de una variable en función del valor de dos o más variables. La variable que queremos predecir se llama variable dependiente (o a veces, variable de resultado, objetivo o criterio)., Las variables que estamos utilizando para predecir el valor de la variable dependiente se denominan variables independientes (o a veces, variables predictoras, explicativas o regresoras).

por ejemplo, podría usar la regresión múltiple para comprender si el rendimiento del examen se puede predecir en función del tiempo de revisión, la ansiedad ante los exámenes, la asistencia a clases y el género. Alternativamente, podría usar la regresión múltiple para comprender si el consumo diario de cigarrillos se puede predecir en función de la duración del tabaquismo, la edad cuando comenzó a fumar, el tipo de fumador, los ingresos y el género.,

la regresión múltiple también le permite determinar el ajuste general (varianza explicada) del modelo y la contribución relativa de cada uno de los predictores a la varianza total explicada. Por ejemplo, es posible que desee saber cuánto de la variación en el rendimiento del examen puede explicarse por el tiempo de revisión, la ansiedad ante los exámenes, la asistencia a las conferencias y el género «en su conjunto», pero también la «contribución relativa» de cada variable independiente para explicar la varianza.,

esta guía de «inicio rápido» le muestra cómo realizar regresión múltiple utilizando estadísticas SPSS, así como interpretar e informar los resultados de esta prueba. Sin embargo, antes de presentarle este procedimiento, debe comprender las diferentes suposiciones que deben cumplir sus datos para que la regresión múltiple le brinde un resultado válido. Discutimos estas suposiciones a continuación.,

estadísticas SPSS

suposiciones

cuando elige analizar sus datos mediante regresión múltiple, parte del proceso implica verificar para asegurarse de que los datos que desea analizar puedan analizarse realmente mediante regresión múltiple. Debe hacer esto porque solo es apropiado usar regresión múltiple si sus datos «pasan» ocho supuestos que se requieren para que la regresión múltiple le brinde un resultado válido., En la práctica, verificar estas ocho suposiciones solo agrega un poco más de tiempo a su análisis, lo que requiere que haga clic en algunos botones más en las estadísticas de SPSS al realizar su análisis, así como pensar un poco más sobre sus datos, pero no es una tarea difícil.

antes de presentarle estas ocho suposiciones, no se sorprenda si, al analizar sus propios datos utilizando estadísticas SPSS, se viola una o más de estas suposiciones (es decir, no se cumplen)., Esto no es raro cuando se trabaja con datos del mundo real en lugar de ejemplos de libros de texto, que a menudo solo le muestran cómo llevar a cabo la regresión múltiple cuando todo va bien! Sin embargo, no te preocupes. Incluso cuando sus datos fallan ciertas suposiciones, a menudo hay una solución para superar esto. Primero, echemos un vistazo a estas ocho suposiciones:

  • suposición # 1: su variable dependiente debe medirse en una escala continua (es decir, es una variable de intervalo o relación)., Ejemplos de variables que cumplen este criterio incluyen el tiempo de revisión (medido en horas), la inteligencia (medida mediante la puntuación de CI), el rendimiento del examen (medido de 0 a 100), el peso (medido en kg), y así sucesivamente. Puede obtener más información sobre las variables de intervalo y relación en nuestro artículo: tipos de variables. Si su variable dependiente se midió en una escala ordinal, tendrá que llevar a cabo regresión ordinal en lugar de regresión múltiple. Ejemplos de variables ordinales incluyen elementos Likert (p. ej.,, una escala de 7 puntos desde «muy de acuerdo «hasta» muy en desacuerdo»), entre otras formas de clasificar categorías (por ejemplo, una escala de 3 puntos que explica cuánto le gustó a un cliente un producto, que va desde» no mucho «hasta»Sí, mucho»).
  • suposición #2: tiene dos o más variables independientes, que pueden ser continuas (es decir, una variable de intervalo o relación) o categóricas (es decir, una variable ordinal o nominal). Para ejemplos de variables continuas y ordinales, vea la viñeta anterior. Ejemplos de variables nominales incluyen género (por ejemplo, 2 grupos: masculino y femenino), etnia (por ejemplo.,, 3 grupos: Caucásico, Afroamericano e Hispano), nivel de actividad física (por ejemplo, 4 grupos: sedentario, bajo, moderado y alto), profesión (por ejemplo, 5 grupos: cirujano, médico, enfermera, dentista, terapeuta), y así sucesivamente. Una vez más, puede obtener más información sobre las variables en nuestro artículo: tipos de variables. Si una de sus variables independientes es dicotómica y se considera una variable moderadora, es posible que deba ejecutar un análisis de moderador dicotómico.
  • suposición #3: Usted debe tener independencia de observaciones (i. e.,, independence of residuals), que se puede comprobar fácilmente utilizando la estadística de Durbin-Watson, que es una prueba sencilla de ejecutar utilizando estadísticas SPSS. Explicamos cómo interpretar el resultado de la estadística de Durbin-Watson, así como el procedimiento estadístico SPSS requerido, en nuestra guía de regresión múltiple mejorada.
  • suposición # 4: tiene que haber una relación lineal entre (a) la variable dependiente y cada una de sus variables independientes, y (b) La variable dependiente y las variables independientes colectivamente., Si bien hay varias formas de verificar estas relaciones lineales, sugerimos crear gráficas de dispersión y gráficas de regresión parcial utilizando estadísticas SPSS, y luego inspeccionar visualmente estas gráficas de dispersión y gráficas de regresión parcial para verificar la linealidad. Si la relación mostrada en las gráficas de dispersión y las gráficas de regresión parcial no son lineales, tendrá que ejecutar un análisis de regresión no lineal o «transformar» sus datos, lo que puede hacer utilizando las estadísticas de SPSS., En nuestra guía de regresión múltiple mejorada, le mostramos cómo: (a) crear gráficas de dispersión y gráficas de regresión parcial para verificar la linealidad al llevar a cabo una regresión múltiple utilizando estadísticas SPSS; (b) interpretar diferentes resultados de gráficas de dispersión y gráficas de regresión parcial; y (c) transformar sus datos utilizando estadísticas SPSS si no tiene relaciones lineales entre sus variables.
  • suposición #5: sus datos deben mostrar homoscedasticidad, que es donde las variaciones a lo largo de la línea de mejor ajuste permanecen similares a medida que se mueve a lo largo de la línea., Explicamos más sobre lo que esto significa y cómo evaluar la homocedasticidad de sus datos en nuestra guía de regresión múltiple mejorada. Cuando analice sus propios datos, necesitará trazar los residuos estudiados contra los valores predichos no estandarizados. En nuestra guía de regresión múltiple mejorada, explicamos: (a) cómo probar la homocedasticidad utilizando estadísticas SPSS; (b) algunas de las cosas que deberá considerar al interpretar sus datos; y (c) posibles formas de continuar con su análisis si sus datos no cumplen con esta suposición.,
  • suposición # 6: Sus datos no deben mostrar multicolinealidad, que ocurre cuando tiene dos o más variables independientes que están altamente correlacionadas entre sí. Esto lleva a problemas con la comprensión de qué variable independiente contribuye a la varianza explicada en la variable dependiente, así como problemas técnicos en el cálculo de un modelo de regresión múltiple., Por lo tanto, en nuestra guía de regresión múltiple mejorada, le mostramos: (a) cómo usar las estadísticas SPSS para detectar la multicolinealidad a través de una inspección de los coeficientes de correlación y los valores de tolerancia/VIF; y (b) cómo interpretar estos coeficientes de correlación y los valores de tolerancia/VIF para que pueda determinar si sus datos cumplen o violan esta suposición.
  • suposición # 7: no debe haber valores atípicos significativos, puntos de apalancamiento altos o puntos altamente influyentes., Los valores atípicos, el apalancamiento y los puntos influyentes son términos diferentes utilizados para representar observaciones en su conjunto de datos que son de alguna manera inusuales cuando desea realizar un análisis de regresión múltiple. Estas diferentes clasificaciones de puntos inusuales reflejan el diferente impacto que tienen en la línea de regresión. Una observación se puede clasificar como más de un tipo de punto inusual. Sin embargo, todos estos puntos pueden tener un efecto muy negativo en la ecuación de regresión que se utiliza para predecir el valor de la variable dependiente en función de las variables independientes., Esto puede cambiar el resultado que produce SPSS Statistics y reducir la precisión predictiva de sus resultados, así como la significación estadística. Afortunadamente, al usar Estadísticas SPSS para ejecutar regresión múltiple en sus datos, puede detectar posibles valores atípicos, puntos de alto apalancamiento y puntos altamente influyentes., En nuestra guía de regresión múltiple mejorada: (a) le mostramos cómo detectar valores atípicos utilizando «casewise diagnostics» y «residuos eliminados estudiados», que puede hacer utilizando las estadísticas de SPSS, y discutimos algunas de las opciones que tiene para lidiar con valores atípicos; (b) Verifique los puntos de apalancamiento utilizando las estadísticas de SPSS y discuta lo que debe hacer si tiene alguno; y (c) verifique los puntos influyentes en las estadísticas de SPSS utilizando una medida de influencia conocida como distancia de Cook, antes de presentar algunos enfoques prácticos en las estadísticas de SPSS para lidiar con cualquier punto influyente que pueda tener.,
  • suposición # 8: finalmente, debe verificar que los residuos (errores) se distribuyan aproximadamente normalmente (explicamos estos Términos en nuestra guía de regresión múltiple mejorada). Dos métodos comunes para verificar esta suposición incluyen el uso de: (a) un histograma (con una curva normal superpuesta) y una gráfica P-P Normal; o (b) una gráfica Q-Q Normal de los residuos estudiados., Una vez más, en nuestra guía de regresión múltiple mejorada: (a) le mostramos cómo verificar esta suposición utilizando estadísticas SPSS, si utiliza un histograma (con curva normal superpuesta) y un gráfico P-P Normal, o un gráfico Q-Q Normal; (B) explicar cómo interpretar estos diagramas; y (c) proporcionar una posible solución si sus datos no cumplen con esta suposición.

puede comprobar suposiciones #3, #4, #5, #6, #7 y #8 usando estadísticas SPSS. Las suposiciones #1 y #2 deben verificarse primero, antes de pasar a las suposiciones #3, #4, #5, #6, #7 y #8., Solo recuerde que si no ejecuta las pruebas estadísticas sobre estas suposiciones correctamente, los resultados que obtiene al ejecutar la regresión múltiple podrían no ser válidos. Es por eso que dedicamos una serie de secciones de nuestra guía de regresión múltiple mejorada para ayudarlo a hacer esto bien. Puede obtener información sobre nuestro contenido mejorado en su conjunto en nuestra página Características: Descripción general o, más específicamente, aprender cómo ayudamos a probar suposiciones en nuestra página Características: suposiciones.,

en la sección Procedimiento, ilustramos el procedimiento estadístico SPSS para realizar una regresión múltiple asumiendo que no se han violado las suposiciones. En primer lugar, presentamos el ejemplo que se utiliza en esta guía.

estadísticas SPSS

ejemplo

Un investigador de salud quiere ser capaz de predecir «VO2max», un indicador de aptitud y salud. Normalmente, para realizar este procedimiento requiere equipo de laboratorio costoso y requiere que un ejercicio individual a su máximo (es decir, hasta que puedan continuar haciendo ejercicio por más tiempo debido al agotamiento físico)., Esto puede desanimar a aquellos individuos que no son muy activos/aptos y aquellos individuos que podrían estar en mayor riesgo de mala salud (por ejemplo, sujetos no aptos mayores). Por estas razones, ha sido deseable encontrar una manera de predecir el VO2máx de un individuo basado en atributos que se pueden medir de manera más fácil y barata. Con este fin, un investigador reclutó a 100 participantes para realizar una prueba de VO2max máximo, pero también registró su «edad», «peso», «frecuencia cardíaca» y «sexo». La frecuencia cardíaca es el promedio de los últimos 5 minutos de una prueba de ciclismo de 20 minutos, mucho más fácil y con menor carga de trabajo., El objetivo del investigador es ser capaz de predecir el VO2máx en función de estos cuatro atributos: edad, peso, frecuencia cardíaca y sexo.

SPSS Statistics

Setup en SPSS Statistics

en SPSS Statistics, creamos seis variables: (1) VO2max, que es la capacidad aeróbica máxima; (2) edad, que es la edad del participante; (3) peso, que es el peso del participante (técnicamente, es su ‘masa’); (4) heart_rate, que es la frecuencia cardíaca del participante; (5) género, que es el género del participante; y (6) caseno, que es el número de caso., La variable caseno se utiliza para facilitar la eliminación de casos (por ejemplo, «valores atípicos significativos», «puntos de alto apalancamiento» y «puntos altamente influyentes») que haya identificado al verificar suposiciones. En nuestra guía de regresión múltiple mejorada, le mostramos cómo ingresar datos correctamente en las estadísticas de SPSS para ejecutar una regresión múltiple cuando también está verificando suposiciones. Puede obtener más información sobre nuestro contenido de configuración de datos mejorada en nuestra página Características: configuración de datos. También puede consultar nuestra guía genérica de «inicio rápido»: introducción de datos en las estadísticas de SPSS.,

SPSS Statistics

procedimiento de prueba en SPSS Statistics

Los Siete Pasos siguientes le muestran cómo analizar sus datos mediante regresión múltiple en SPSS Statistics cuando no se ha violado ninguna de las ocho suposiciones de la sección anterior, suposiciones. Al final de estos siete pasos, le mostramos cómo interpretar los resultados de su regresión múltiple., Si está buscando ayuda para asegurarse de que sus datos cumplan con las suposiciones #3, #4, #5, #6, #7 y #8, que se requieren cuando se usa regresión múltiple y se pueden probar con estadísticas SPSS, puede obtener más información en nuestra guía mejorada (consulte nuestra página Características: Descripción general para obtener más información).

  1. haga Clic en Analizar el > Regresión > Lineal… en el menú principal, como se muestra a continuación:

    publicado con permiso por escrito de SPSS Statistics, IBM Corporation.,

    Nota: no se preocupe que usted está seleccionando a Analizar > Regresión > Lineal… en el menú principal o que los cuadros de diálogo en los pasos que siguen tengan el título, regresión lineal. No has cometido un error. Usted está en el lugar correcto para llevar a cabo el procedimiento de regresión múltiple. Este es solo el título que da SPSS Statistics, incluso cuando se ejecuta un procedimiento de regresión múltiple.,

  2. Se le presentará el cuadro de diálogo de regresión lineal a continuación:

    publicado con permiso por escrito de SPSS Statistics, IBM Corporation.,

  3. transfiera la variable dependiente, VO2max, al cuadro Dependent: y las variables independientes, age, weight, heart_rate y gender al cuadro Independent(s):, utilizando los botones, como se muestra a continuación (todos los demás cuadros se pueden ignorar):

    publicado con permiso por escrito de SPSS Statistics, IBM Corporation.,

    nota: para una regresión múltiple estándar, debe ignorar los botones y , ya que son para la regresión múltiple secuencial (jerárquica). La opción Method: debe mantenerse en el valor predeterminado, que es . Si, por cualquier razón, no está seleccionado, debe cambiar el método: volver a . El método es el nombre dado por SPSS Statistics al análisis de regresión estándar.,

  4. haga clic en el botón . Se le presentará el cuadro de diálogo regresión lineal: estadísticas, como se muestra a continuación:

    publicado con permiso por escrito de SPSS Statistics, IBM Corporation.

  5. Además de las opciones seleccionadas por defecto, seleccione intervalos de confianza en el área– coeficientes de regresión-dejando la opción Level (%): en «95»., Terminará con la siguiente pantalla:

    publicado con permiso por escrito de SPSS Statistics, IBM Corporation.

  6. haga Clic en el botón. Será devuelto al cuadro de diálogo de regresión lineal.
  7. haga clic en el botón . Esto generará la salida.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *