introdução
regressão múltipla é uma extensão de regressão linear simples. É usado quando queremos predizer o valor de uma variável baseada no valor de duas ou mais outras variáveis. A variável que queremos prever é chamada de variável dependente (ou às vezes, a variável resultado, alvo ou critério)., As variáveis que estamos usando para prever o valor da variável dependente são chamadas de variáveis independentes (ou às vezes, as variáveis predictor, explicativa ou regressor).
Por exemplo, você pode usar regressão múltipla para entender se o desempenho do exame pode ser previsto com base no tempo de revisão, ansiedade de teste, frequência de leitura e sexo. Alternadamente, você pode usar regressão múltipla para entender se o consumo diário de cigarros pode ser previsto com base na duração do tabagismo, idade quando começou a fumar, tipo de fumante, renda e gênero.,
regressão múltipla também permite determinar o ajuste geral (variância explicada) do modelo e a contribuição relativa de cada um dos predictores para a variância total explicada. Por exemplo, você pode querer saber quanto da variação no desempenho do exame pode ser explicada pelo tempo de revisão, ansiedade de teste, assiduidade de leitura e gênero “como um todo”, mas também a “contribuição relativa” de cada variável independente na explicação da variância.,
Este guia de “arranque rápido” mostra-lhe como efectuar regressão múltipla utilizando Estatísticas SPSS, bem como interpretar e comunicar os resultados deste teste. No entanto, antes de apresentá-lo a este procedimento, você precisa entender os diferentes pressupostos que seus dados devem cumprir para que a regressão múltipla lhe dê um resultado válido. Vamos discutir estas suposições a seguir.,
estatísticas de SPSS
hipóteses
quando você optar por analisar os seus dados usando regressão múltipla, parte do processo envolve verificar se os dados que você deseja analisar podem realmente ser analisados usando regressão múltipla. Você precisa fazer isso porque só é apropriado usar regressão múltipla se seus dados “passam” oito suposições que são necessárias para a regressão múltipla para lhe dar um resultado válido., Na prática, verificar estes oito pressupostos apenas adiciona um pouco mais de tempo à sua análise, exigindo que você clique em mais alguns botões nas estatísticas de SPSS ao realizar a sua análise, bem como pensar um pouco mais sobre os seus dados, mas não é uma tarefa difícil.
Antes de lhe introduzirmos estes oito pressupostos, não se surpreenda se, ao analisar os seus próprios dados usando estatísticas de SPSS, uma ou mais destas hipóteses for violada (isto é, não satisfeita)., Isso não é incomum quando se trabalha com dados do mundo real em vez de exemplos de livros, que muitas vezes só mostram como realizar regressão múltipla quando tudo corre bem! No entanto, não te preocupes. Mesmo quando seus dados falham em certas suposições, muitas vezes há uma solução para superar isso. Primeiro, vamos dar uma olhada nessas oito suposições:
- suposição #1: sua variável dependente deve ser medida em uma escala contínua (ou seja, é uma variável de intervalo ou razão)., Exemplos de variáveis que cumprem este critério incluem tempo de revisão (medido em horas), inteligência (medido usando pontuação de QI), desempenho do exame (medido de 0 a 100), peso (medido em kg), e assim por diante. Você pode aprender mais sobre variáveis de intervalo e rácio em nosso artigo: Tipos de variáveis. Se a sua variável dependente foi medida numa escala ordinal, terá de efectuar regressão ordinal em vez de regressão múltipla. Exemplos de variáveis ordinais incluem itens Likert (e.g.,, uma escala de 7 pontos de ” concordo fortemente “até” discordar fortemente”), entre outras formas de classificação categorias (por exemplo, uma escala de 3 pontos explicando o quanto um cliente gostava de um produto, variando de” não muito “a”sim, muito”).
- suposição #2: você tem duas ou mais variáveis independentes, que podem ser contínuas (i.e., um intervalo ou uma variável de razão) ou categóricas (i.e., uma variável ordinal ou nominal). Para exemplos de variáveis contínuas e ordinais, veja a bala acima. Exemplos de variáveis nominais incluem gênero (por exemplo, 2 grupos: masculino e feminino), etnia (por exemplo, Sexo).,, 3 grupos: Caucasianos, Afro-Americanos e Hispânicos), o nível de atividade física (por exemplo, 4 grupos: sedentários, baixo, moderado e alto), profissão (por exemplo, 5 grupos: cirurgião, médico, enfermeiro, dentista, terapeuta), e assim por diante. Mais uma vez, você pode aprender mais sobre variáveis em nosso artigo: Tipos de variáveis. Se uma de suas variáveis independentes é dicotômica e considerada uma variável moderadora, você pode precisar executar uma análise moderadora dicotômica.suposição # 3: você deve ter independência das observações (i.e.,, independence of residuals), que você pode facilmente verificar usando a estatística Durbin-Watson, que é um teste simples para executar usando estatísticas SPSS. Nós explicamos como interpretar o resultado da estatística de Durbin-Watson, bem como mostrar-lhe o procedimento de Estatísticas SPSS necessário, em nosso guia de regressão múltipla aprimorado.
- pressuposto #4: tem de haver uma relação linear entre (a) a variável dependente e cada uma das suas variáveis independentes, e (b) a variável dependente e as variáveis independentes colectivamente., Embora haja uma série de maneiras de verificar essas relações lineares, sugerimos a criação de scatterplots e parcelas de regressão parcial usando estatísticas SPSS, e, em seguida, inspeccionando visualmente estes scatterplots e parcelas de regressão parcial para verificar a linearidade. Se a relação mostrada no seu scatterplots e gráficos de regressão parcial não forem lineares, você terá que executar uma análise de regressão não-linear ou “transformar” os seus dados, o que você pode fazer usando estatísticas de SPSS., No nosso avançado de regressão múltipla guia, vamos mostrar-lhe como: (a) criar gráficos de dispersão e regressão parcial parcelas para verificar a linearidade quando da realização de regressão múltipla utilizando o SPSS Statistics; (b) interpretar os diferentes gráfico de dispersão e regressão parcial enredo resultados; e (c) a transformar seus dados usando o SPSS Statistics se você não tem relações lineares entre as variáveis.
- suposição # 5: seus dados precisam mostrar homoscedasticidade, que é onde as variâncias ao longo da linha de melhor ajuste permanecem semelhantes à medida que você se move ao longo da linha., Explicamos mais sobre o que isso significa e como avaliar a homoscedasticidade de seus dados em nosso guia de regressão múltipla aprimorado. Quando você analisar seus próprios dados, você precisará plotar os resíduos studentizados contra os valores previstos nãoandardizados. No nosso guia de regressão múltipla melhorada, explicamos: (a) como testar a homoscedasticidade usando estatísticas SPSS; (B) algumas das coisas que você precisará considerar ao interpretar seus dados; e (c) possíveis maneiras de continuar com sua análise se seus dados não atenderem a esta suposição.,suposição # 6: Seus Dados não devem mostrar multicolinearidade, o que ocorre quando você tem duas ou mais variáveis independentes que estão altamente correlacionadas umas com as outras. Isto leva a problemas com a compreensão que variável independente contribui para a variância explicada na variável dependente, bem como questões técnicas no cálculo de um modelo de regressão múltipla., Por isso, no nosso guia de regressão múltipla melhorada, mostramos-lhe: (a) como utilizar as Estatísticas SPSS para detectar a multicolinaridade através de uma inspecção dos coeficientes de correlação e dos valores de tolerância/VIF; e (b) como interpretar estes coeficientes de correlação e os valores de tolerância/VIF para que possa determinar se os seus dados cumprem ou violam esta suposição.suposição # 7: não deve haver discrepâncias significativas, altos pontos de alavancagem ou pontos altamente influentes., Aberrações, alavancagem e pontos influentes são termos diferentes usados para representar observações em seu conjunto de dados que são de alguma forma incomuns quando você deseja realizar uma análise de regressão múltipla. Estas diferentes classificações de pontos incomuns refletem o impacto diferente que têm na linha de regressão. Uma observação pode ser classificada como mais de um tipo de ponto incomum. No entanto, todos estes pontos podem ter um efeito muito negativo na equação de regressão que é usada para prever o valor da variável dependente com base nas variáveis independentes., Isso pode alterar a saída que as Estatísticas SPSS produzem e reduzir a precisão preditiva de seus resultados, bem como a significância estatística. Felizmente, ao usar Estatísticas SPSS para executar regressão múltipla em seus dados, você pode detectar possíveis valores anómalos, altos pontos de alavancagem e pontos altamente influentes., No nosso avançado de regressão múltipla guia, temos: (a) mostrar como detectar outliers usando “casewise diagnóstico” e “studentized excluídos os resíduos”, o que você pode fazer usando o SPSS Statistics, e discutir algumas das opções que você tem para lidar com valores isolados; (b) seleção para pontos de alavancagem usando o SPSS Statistics e discutir o que você deve fazer se você tiver qualquer; e (c) seleção de pontos influentes no SPSS Statistics, utilizando uma medida de influência conhecido como Distância de Cook, antes de apresentar algumas abordagens práticas no SPSS Statistics para lidar com qualquer influentes pontos que você pode ter.,
- suposição #8: finalmente, você precisa verificar que os resíduos (erros) são aproximadamente normalmente distribuídos (nós explicamos estes termos em nosso guia de regressão múltipla aprimorado). Dois métodos comuns para verificar esta suposição incluem: (a) um histograma (com uma curva normal sobreposta) e uma parcela P-P Normal; ou (b) uma parcela Q-Q Normal dos resíduos studentizados., Novamente, no nosso avançado de regressão múltipla guia, temos: (a) mostrar a você como verificar essa suposição usando o SPSS Statistics, se você usar um histograma (sobreposta curva normal) e Normal P-P Plot, ou Normal Q-Q Plot; (b) explique como interpretar esses diagramas; e (c) fornecer uma solução possível se os dados de falha para atender a esse pressuposto.
pode verificar os pressupostos #3, #4, #5, #6, #7 e número 8 usando estatísticas SPSS. Os pressupostos #1 e # 2 devem ser verificados primeiro, antes de passar aos pressupostos #3, #4, #5, #6, #7 e número 8., Basta lembrar que se você não executar os testes estatísticos sobre estes pressupostos corretamente, os resultados que você obtém ao executar regressão múltipla pode não ser válido. É por isso que dedicamos uma série de seções do nosso guia de regressão múltipla melhorado para ajudá-lo a fazer isso direito. Você pode descobrir sobre o nosso conteúdo melhorado como um todo em nossas características: página de visão geral, ou mais especificamente, aprender como nós ajudamos com o teste de suposições em nossas características: página de suposições.,
na secção, procedimento, nós ilustramos o procedimento de estatísticas de SPSS para realizar uma regressão múltipla assumindo que nenhuma suposição foi violada. Em primeiro lugar, apresentamos o exemplo que é utilizado neste guia.
estatísticas de SPSS
exemplo
um pesquisador de saúde quer ser capaz de prever “VO2max”, um indicador de aptidão e saúde. Normalmente, para realizar este procedimento requer equipamento de laboratório caro e exige que um exercício individual ao seu máximo (ou seja, até que eles possam continuar a exercer por mais tempo devido à exaustão física)., Isso pode afastar os indivíduos que não são muito ativos/aptos e aqueles indivíduos que podem estar em maior risco de doença (por exemplo, indivíduos mais velhos impróprios). Por estas razões, tem sido desejável encontrar uma maneira de prever o VO2max de um indivíduo com base em atributos que podem ser medidos de forma mais fácil e barata. Para isso, um pesquisador recrutou 100 participantes para realizar um teste VO2max máximo, mas também gravou sua “idade”, “Peso”, “Frequência Cardíaca” e “gênero”. Frequência cardíaca é a média dos últimos 5 minutos de um teste de ciclismo de 20 minutos, muito mais fácil e de menor carga de trabalho., O objetivo do pesquisador é ser capaz de prever VO2max com base nestes quatro atributos: idade, Peso, Frequência Cardíaca e gênero.
SPSS Statistics
o programa de Instalação no SPSS Statistics
Em SPSS Statistics, criamos seis variáveis: (1) o VO2max, que é a máxima capacidade aeróbica; (2) idade, que é a idade do participante; (3) o peso, que é o participante de peso (tecnicamente, é a sua “massa”); (4) heart_rate, que é o participante da freqüência cardíaca; (5) o género, qual é o participante do sexo; e (6) caseno, que é o número do processo., A variável caseno é usada para facilitar a eliminação de casos (por exemplo, “anómalos significativos”, “pontos de alavancagem altos” e “pontos altamente influentes”) que você identificou ao verificar suposições. No nosso guia de regressão múltipla melhorada, mostramos-lhe como introduzir correctamente os dados nas estatísticas de SPSS para executar uma regressão múltipla quando também está a verificar as hipóteses. Você pode aprender sobre o nosso conteúdo de configuração de dados melhorada em nossas funcionalidades: página de configuração de dados. Alternadamente, consulte o nosso guia Genérico “arranque rápido”: introduzir dados nas estatísticas SPSS.,as sete etapas abaixo mostram como analisar os seus dados usando regressão múltipla nas estatísticas de SPSS quando nenhuma das oito hipóteses da secção anterior, pressupostos, foi violada. No final destes sete passos, mostramos-lhe como interpretar os resultados da sua regressão múltipla., Se você está procurando por Ajuda para se certificar de que seus dados atendem a suposições #3, #4, #5, #6, #7 e #8, que são necessários ao usar regressão múltipla e podem ser testados usando estatísticas SPSS, você pode aprender mais em nosso guia melhorado (veja nossas características: página de visão geral para saber mais).
- clicar analisar >Regressão> Linear… no menu principal, como mostrado abaixo:
publicado com permissão por escrito da SPSS Statistics, IBM Corporation.,
Nota: não se preocupe que você está selecionando Analisar > Regressão > Linear… no menu principal ou que as caixas de diálogo nas etapas que se seguem têm o título, Regressão Linear. Não cometeu um erro. Você está no lugar certo para realizar o procedimento de regressão múltipla. Este é apenas o título que as Estatísticas SPSS dão, mesmo quando executando um procedimento de regressão múltipla.,
- você será apresentado com a caixa de diálogo de regressão Linear abaixo:
publicado com permissão por escrito da SPSS Statistics, IBM Corporation.,
- Transferência a variável dependente, o valor de VO2max, para o Dependente: caixa e as variáveis independentes a idade, o peso, heart_rate e de género no Independente(s): caixa, usando o botões, como mostrado abaixo (todos os outros campos podem ser ignorados):
Publicado com a permissão por escrito do SPSS Statistics, da IBM Corporation.,
Nota: para uma regressão múltipla padrão, deve ignorar os botões e como são para regressão múltipla sequencial (hierárquica). The Method: option needs to be kept at the default value, which is . Se, por qualquer razão, não estiver seleccionado, terá de mudar o método: de volta para . O método é o nome dado pelas estatísticas de SPSS à análise de regressão padrão.,
- clique no botão. Você será apresentado com a regressão Linear: caixa de diálogo de estatísticas, como mostrado abaixo:
publicado com permissão por escrito da SPSS Statistics, IBM Corporation.
- Para além das opções que são seleccionadas por omissão, seleccione os intervalos de confiança na área –coeficientes de regressão– deixando o nível(%): opção em “95”., Você vai acabar com a seguinte tela:
publicado com permissão por escrito da SPSS Statistics, IBM Corporation.
- clique no botão. Você será devolvido à caixa de diálogo de regressão Linear.clique no botão . Isto irá gerar a saída.
Deixe uma resposta