1. Trang chủ
  2. » Thể loại khác

TIPO DA VARIÁVEL

26 2 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

TIPO DA VARIÁVEL NUMÉRICAS CATEGÓRICAS (Incluso as “ordinais”) (qualquer var pode ser categorizada) NUMẫRICA -Coef de correlaỗóo; -Anỏlise de regressóo V A R I Á -Testes ´t´; V CATEGÓRICA -ANOVA E -Similares nóo-paraL mộtricos -Teste de proporỗóo -Testes Qui-Quadrado Temos a situaỗóo cujo o objetivo ộ comparar uma proporỗóo (p) de uma variável categórica ou categorizada, obtida através de uma amostra, com uma proporỗóo conhecida de uma populaỗóo (situaỗóo análoga a comparar uma média amostral com uma média conhecida) Portanto a var em questão deve ser uma variável categórica ou que foi categorizada Exemplos: - A proporỗóo de mulheres ansiosas na pús-graduaỗóo ộ equivalente proporỗóo de mulheres ansiosas na pop em geral; - A proporỗóo de pessoas acima de 50 anos com depressão na zona rural é equivalente zona urbana (conhecida); -A proporỗóo de negros nas universidades ộ equivalente proporỗóo na sociedade Suposiỗóo: As observaỗừes (xi) são independentes uma das outras Teste de hipótese associado: H0: p = п (prop conhecida) X H1: p ≠ п; ou simplesmente: H0 : as proporỗừes sóo equivalentes X H1: as proporỗừes nóo sóo equivalentes Lembrando que a proporỗóo ộ numero de resultados que interessam, de respostas de uma categoria, dividido pelo tamanho da amostra (p = x/n) Teste estatístico: Teste para a comparaỗóo de uma proporỗóo Procedimento: A estatớstica onde SE p0 = proporỗóo conhecida; tem distribuiỗóo Z (Normal (0,1)) Então acho o valor da est e comparo com o valor da distribuiỗóo Z com nớvel de significõncia = 0.05 OU (mais comum) verifico qual a probabilidade valor da est na distr Z comparo com = 0.05 Se for menor rejeito HO Exemplo: Uma amostra de 40 alunos de determinada escola foi coletada e verificou-se que 16 estavam acima ponto de corte de uma escala de stress Sabe que a proporỗóo de alunos estressados na populaỗóo gira em torno de 27% Estes alunos estão mais ou menos estressados que o normal? Efetuando os cálculos temos: p =16/40 = 0.40%, SE = (0.40*0.60)/40 = 0.006, cuja raiz quadrada = 0.0775, então 0.40 -0.27 = 0.13, que dividido por 0.0775 dỏ 1.677, que na distribuiỗóo Z equivale a um p = 0.10, logo não rejeitamos H0, os alunos não estão mais estressados que a média Vejamos no programa estatístico MINITAB como realizá-lo Na barra de ferramentas vamos em ´Stat´, depois ´Basic Statistics´ e daí em ´1 Proportion´ no ícone ` Options´ Na tela resultante ativamos a janela ´Summarized data´, em `Number of trials´ colocamos o tamanho da amostra (40) e em ´Number of successes´ o número de resultados que nos interessam (16) e então clicamos Na tela Options vamos em `Test proportion: e digitamos a proporỗóo conhecida da populaỗóo (0.27) O default programa ộ 0.50 A janela Alternative` com a inscriỗóo not equal refere-se a um teste bicaudal Depois OK e OK No output temos o teste de hipótese realizado (bicaudal), o no de sucessos, o tamanho da amostra, a proporỗóo estimada, um I.C de 95 para esta proporỗóo e o p value Suponha que os alunos exemplo anterior fossem de uma escola localiza da em um bairro conhecido por sua violência, e a pesquisadora estivesse, a priori, interessada em saber se a taxa de stress era superior taxa média de 27% Neste caso especớfico pode-se optar pela realizaỗóo de um teste monocaudal: H0: p ≤ p0 X H1: p > p0 A ỳnica modificaỗóo necessỏria para este teste ộ ir no ´Options´ e na janela ´Alternative´ marcarmos a opỗóo greater than, que corresponde ao teste monocaudal Nos resultados temos o teste monocaudal, as saídas anteriormente vistas e o valor de p = 0.05, então no teste monocaudal rejeitamos que as taxas de stress são equivalentes, diferente anterior, pois são testes diferentes É necessário justificar o uso teste monocaudal antes da realizaỗóo Objetivo: Comparar duas proporỗừes oriundas de duas amostras de populaỗừes independentes Observe que teremos duas vars no nosso banco de dados, uma referente s populaỗừes e a outra referente ao que se quer comparar, por exemplo, comparar o percentual de crianỗas com problemas de aprendizado entre duas escolas Suposiỗừes: - Dentro de cada amostra as observaỗừes (xi) sóo independentes; As amostras sóo independentes entre si; Cada observaỗóo, cada unidade amostral só pode ser categorizada em uma e somente uma categoria, ou seja, as categorias das variáveis são mutuamente exclusivas Teste de hipútese associado H0: Hỏ associaỗóo entre as variỏveis X H1: Nóo hỏ associaỗóo entre as variỏveis Teste estatớstico: O teste utilizado neste tipo de situaỗóo ộ denominado teste Qui-Quadrado (χ²), vejamos, utilizando o exemplo anterior, como é calculada esta estatística Vamos em ´ Stats´ , ´Tables’ e daí em ´Cross Tabulations´, que irá cruzar as variáveis, criar uma tabela de contingência Na nova tela alocamos as vars.em ‘Classification variables’, e acionamos ‘Row percents’ e Chi-Square analysis’ e OK Ao lado temos a tabela de contingência gerada, onde vemos que na escola temos 20 pessoas sem problemas e 12 com já na escola temos 20 sem e com problemas Estes valores são ditos frequências observadas Temos também os percentuais por linha, 62,5% na escola A não tem problemas e 37,5% tem; na escola B 71,4% não tem e 28,6% tem O fato de calcularmos o percentual nas linhas ou nas colunas não altera o valor cỏlculo, tanto faz, ộ uma opỗóo de como o pesquisador quer demonstrar seus resultados Abaixo da tabela de contingência temos o valor da est calculada (0,54) e o p-value correspondente ( p = 0,46), logo não rejeito H0, nóo hỏ associaỗóo entre escola e problema, pode-se dizer que o percentual de crianỗas com problemas na escola (37,5%) nóo difere significativamente percentual de crianỗas com problemas na escola (28,6%) Podemos então verificar que o teste Х² realiza a comparaỗóo entre dois percentuais em tabelas com duas variáveis com duas categorias Além das frequências observadas existem as frequências esperadas, que são calculadas a partir das marginais das linhas (32 e 26) e das marginais das colunas (40 e 20) As freq esperadas para cada casela são estimadas seguinte modo: Cas 1(linha) 1(coluna) = [Marg linha (32) * Marg coluna (40)]/ Total (60) = (32*40)/60 = 21,33 Cas 1(linha) 2(coluna) = [Marg linha (32) * Marg coluna (20)]/ Total (60) = (32*20)/60 = 10,67 E assim por diante para cada uma das caselas da tabela O teste χ² basicamente irá medir se a distância entre o observado e o Podemos ser mais específicos ainda no nosso teste de hipótese: H0: O percentual de crianỗas com problemas entre as duas escolas ộ equivalente; X H1 Não é equivalente OU H0: p1 = p2; X H0: p1 p2 Existe uma restriỗóo uma condiỗóo muito importante para a aplicaỗóo : Nóo pode haver mais de 20% das caselas com valor esperado menor que Então em um tabela 2X2 basta uma casela Quando isto ocorrer (ao menos uma casela com valor esperado < 5) utilizamos outro teste, o teste exato X2 , cujas as hipúteses e suposiỗừes sóo as mesmas, exceto a acima exposta Exemplo em uma tabela X 2: A seguinte estatística fornece diretamente o valor de p a ser comparado com o nível de significância adotado, onde Imaginemos a seguinte tabela: Deseja-se verificar se o percentual de resposta entre as drogas é equivalentes, então o cálculo ộ: Entóo p = 0.009, rejeito H0, as proporỗừes sóo significativamente diferentes Mas como faỗo para saber se a condiỗóo anteriormente vista está sendo satisfeita ? O Minitab avisa-nos automaticamente Na tabela ao lado temos as vars Sexo e Prática de religião, note que abaixo dos resultados temos o aviso: cells with expected counts less than 5: células com valor esperado abaixo de Portanto a condiỗóo nóo está satisfeita, de caselas = 50% das caselas, logo o teste não tem validade, necessário aplicar o teste exato de Fisher O raciocínio teste χ² estende-se para tabela 2x3, 3x3, 4x2, 5x3, enfim para qualquer tabela de contingência LxC Abaixo temos uma tabela das vars Droga X Curso, podemos ver que hỏ diferenỗa significativa, a proporỗóo de usuỏrios de drogas varia significativamente conforme o curso Qual o teste de hipótese aqui?? Mas quem difere de quem ? Tal qual na Anova, uma saída é particionarmos a tabela e realizarmos comparaỗừes em tabelas 2x2 Uma boa idộia ộ iniciar as comparaỗừes pe-los nớveis que apresentarem maior diferenỗa percentual Teoricamente e cada vez mais na prỏtica ộ necessário corrigir os resultados destes testes “post hoc” através de Bonferroni (0.05/no testes), logo analise a tabela (diferenỗas prỏticas) e defina as comparaỗừes a realizar Ao lado temos o cruzamento das vars Curso X Relig., note a quantidade de caselas em branco, aqui não podemos utilizar o teste χ² Também não existe um semelhante de Fisher para tabelas diferentes das 2x2 A ỳnica soluỗóo ộ agrupar nớveis, categorias, de uma, ou das duas vars No agrupamento procu re agrupar as categorias que possuem amostras menores, de modo a eliminá-las No exemplo provavelmente teríamos teríamos de agrupar as religiões 3, e e o curso Obviamente que esse agrupamento precisa fazer sentido, ter lógica, não dá para misturar Comercial e Botafogo (O Botafogo é muiiiito melhor) Tudo o que foi visto até agora refere-se a amostras independentes, vejamos um teste para proporỗừes pareadas Temos o seguinte experimento: Foi aplicada uma escala de depressão em um grupo de mães antes parto (categorizada em 1= Dep e = Não d.) e após o parto Observe a planilha de dados como fica A estatớstica tem distribuiỗóo com (l-1)(c-1) g.l O Minitab não realiza o teste conhecido por Teste de McNemar para dados pareados Porém como a fórmula é simples, calculamos a tabela Minitab e a partir dela efetuamos o cálculo: Então (21-7)² / 21 = 7; 196/28 = O valor numa distr χ² com g.l equivale a um p aproximado de 0.005 Rejeito HO, hỏ diferenỗa O teste de McNemar pode ser aplicado quando há mais de categorias: o desempenho de um grupo de alunos foi classificado em bom, médio e fraco antes e depois da aplicaỗóo de uma intervenỗóo Porém a fórmula é bem mais complexa, não dá para calcular na móo, serỏ necessỏrio um programa que faỗa o cỏlculo Atenỗóo, o teste de McNemar sú ộ calculado em tabelas simétricas ou quadradas,ou seja, quando o no de linhas ộ igual ao no de colunas Situaỗóo na qual a tabela já esta pronta, calculada: Quando vc já tem a tabela, alguém calculou, extraiu de um livro, etc , basta inserir colocar a tabela no Minitab Então vamos em ‘Tables’ e daí em Chi-Square Test’: Na nova tela selecionamos a colunas que contém a tabela e alocamos em/ ‘ Columns containing the tables’ e OK No output temos a tabela, abaixo da tabela as frequências observadas de casela, o cálculo χ² para cada casela, a estatística calculada (7,6) e o p-value correspondente Realiza o cálculo para qualquer tabela L x C, fique atento para o aviso de valores esperados menores que Algumas estatísticas, medidas, bastante utilizadas em tabelas 2X2 PADRÃO OURO (Assumido como a verdade) + TESTE (O que estỏ sendo verificado) - + - Sensibilidade: Proporỗóo de positivos verdadeiros, detectou o valor quando ele realmente ocorreu = a/(a+c) Especificidade: Proporỗóo de negativos verdadeiros, detectou a ausờncia valor quando ele realmente estava ausente = d/(b+d) Valor preditivo positivo: Proporỗóo de positivos verdadeiros em relaỗóo ao total de positivos indicados pelo teste = a/(a+b) Valor preditivo negativo: Proporỗóo de negativos verdadeiros em relaỗóo ao total de negativos indicados pelo teste = d/(c+d) Uma nova escala está sendo testada para detectar estresse, já existe uma escala mundialmente consagrada, mas a nova é mais simples de ser apliada e leva menos tempo para ser aplicada Temos então: Sensibilidade = 53/139 = 38,1% Especificidade = 48/94 = 51,1% Valor preditivo positivo = 53/99 = 53,5% Valor preditivo negativo = 48/134 = 35,8% VC, adotaria ou não o novo teste ?? Risco relativo (RR) = Probabilidade da ocorrência de um evento em um grupo dividido pela probabilidade de ocorrência mesmo evento em outro grupo a/a+b / c/c+d A fórmula cálculo para RR = a*(c+d) , então para a tabela acima temos c*(a+b) 29(12+60) ữ 12 (29+20) = 3,55 INTERPRETAầO: Quem consome mais de doses diárias de álcool tem um risco três vezes e meio maior de ter um distúrbio psic que quem não consome mais de duas doses diárias Como a fórmula é a uma divisão, se as probabilidades forem iguais o RR será 1; então se o RR for superior a temos o chamado fator de risco, se for inferior a temos o fator de prevenỗóo Por exemplo, numa tabela com as vars Atividade Física (S/N) e Depressão (S/N) obteve-se RR = 0.80, então quem pratica atividade física tem 80% da chance de quem Entretanto o RR é calculado somente em estudos prospectivos (os pacientes são selecionados entre os que têm um fator de risco e os que não têm e observa-se o desenvolvimento dos mesmos ao longo tempo Quando temos um estudo retrospectivo (os pacientes já desenvolveram o sintoma e comparam-se os resultados com aqueles que não tiveram o sintoma) a medida semelhante é o ODDS RATIO, cuja fórmula é a*d b*c A tabela acima tem as vars Escola ( = Sem problema e = Com problema) e Depen (0 = pai sem envolvimento com droga e = pai com envolvimento com droga), o odds = (20*15) ÷ (5*14) = 4,3 , portanto os alunos cujos pais tem envolvimento com droga tem 4,3 vezes mais chance de apresentar problemas escolares que aqueles cujos pais não tem envolvimento Veremos um programa simples que calcula as estatísticas anteriormente vistas quando as tabela já estão prontas, o INSTAT Na tela inicial Instat marcamos as opỗừes Analyze a contingency table e ´Two rows, Two columns´ e depois a seta ´Next step´ Na tela seguinte preenchemos a tabela com os valores e clicamos na seta Na nova tela temos várias opỗừes, ou Fisher; mono ou bicaudal; RR ou ODDS ou Sensibilidade, especificidade e valores preditivos Faỗa suas opỗừes e depois clice na seta Na tela final temos os outputs de cada uma das estatísticas solicitadas

Ngày đăng: 11/10/2022, 02:35

Xem thêm:

w