Artigo Com Calculo De Amostragem?
Contents
Quais são os diferentes tipos de amostragem?
Maneiras boas de selecionar uma amostra – Amostra aleatória simples: cada membro ou conjunto de membros tem a mesma chance de ser incluído na amostra. Tecnologia, geradores de números aleatórios ou algum outro tipo de processo aleatório são necessários para obter uma amostra aleatória simples.
Exemplo — um professor coloca os nomes dos alunos em um boné e seleciona alguns sem olhar, para obter uma amostra de alunos. Por que esse método é bom: amostras aleatórias costumam oferecer uma representação verossímil, pois não favorecem determinados membros. Amostra aleatória estratificada: primeiro, a população é dividida em grupos.
A amostra geral consiste em alguns membros de cada grupo. Os membros de cada grupo são escolhidos aleatoriamente. Exemplo — um conselho estudantil entrevista 100 alunos obtendo amostras aleatórias de 25 calouros, 25 alunos do segundo ano, 25 alunos do terceiro ano, e 25 alunos do último ano.
Por que esse método é bom: uma amostra estratificada garante que os membros de cada grupo sejam representados na amostra, então, este método de amostragem é interessante quando queremos incluir alguns membros de cada grupo. Amostra aleatória por agrupamento: primeiro, a população é dividida em grupos.
A amostra geral é formada por todos os membros de alguns dos grupos. Os grupos são selecionados aleatoriamente. Exemplo — uma companhia aérea decide entrevistar seus clientes em um dia, então, eles selecionam, aleatoriamente, 5 voos desse dia e entrevistam todos os passageiros dos voos selecionados.
- Por que esse método é bom: uma amostra por agrupamento envolve todos os membros de alguns dos grupos, então ele é interessante quando cada grupo reflete a população como um todo.
- Amostra aleatória sistemática: os membros da população são colocados em determinada ordem.
- Um ponto inicial é selecionado aleatoriamente, e sempre o n, start superscript, start text, º, end text, end superscript membro é selecionado para entrar na amostra.
Exemplo — o diretor de uma escola usa uma lista com os nomes dos alunos em ordem alfabética e escolhe um ponto inicial aleatório. Sempre o 20, start superscript, start text, º, end text, end superscript aluno é selecionado para responder à pesquisa.
Ver resposta completa
Como calcular o tamanho de uma amostra?
Use a fórmula do tamanho da amostra Coloque os valores do escore-z, desvio padrão e intervalo de confiança na calculadora de tamanho de amostraou use esta fórmula para calcular: Esta equação é para um tamanho de população desconhecido ou muito grande. Se a sua população for menor e conhecida, basta usar a calculadora de tamanho de amostra.
Ver resposta completa
Qual o tamanho da amostra do estudo?
EDITORIAL Tamanho da amostra em estudos clínicos e experimentais Hélio Amante Miot Professor Assistente do Departamento de Dermatologia e Radioterapia da Faculdade de Medicina de Botucatu da Universidade Estadual Paulista (UNESP) – Botucatu (SP), Brasil Estudos investigativos clínico-epidemiológicos ou experimentais objetivam descrever fenômenos ou comparar o comportamento de variáveis em subgrupos de uma população. Para tanto, não se realiza o estudo de todo o universo populacional, usualmente porque não é acessível ou viável, porém, principalmente, porque não é necessário quando se dispõe de uma amostra representativa para a realização de inferências à população-alvo 1,2, O planejamento amostral da pesquisa determina o dimensionamento numérico e também a técnica de amostragem (coleta/seleção) dos elementos de um estudo. É fundamental na elaboração do projeto, e seus problemas podem comprometer a análise final dos dados e interpretação dos resultados. O planejamento amostral adequado depende do conhecimento básico da estatística do estudo e do conhecimento profundo do problema investigado, a fim de que se possa unir a significância estatística dos testes ao significado clínico dos resultados 1,3,4, A maior parte dos testes bioestatísticos pressupõe que a amostra estudada seja probabilisticamente representativa da população. Algumas amostras coletadas por conveniência, como a escolha de pacientes consecutivos de um ambulatório específico, podem não representar adequadamente toda a população do estudo. O pesquisador deve estar atento a possíveis vieses de seleção oriundos da disponibilidade de pacientes em amostragens consecutivas, já que a ampliação do tamanho amostral não corrige o efeito de amostras enviesadas. Além disso, estratégias de amostragens estratificadas não probabilísticas, por quotas, complexas (conglomerados, multiníveis), por resposta voluntária, por saturação de variáveis, tipo “bola de neve” ou com sistemática de coleta não aleatorizada devem ser desenhadas, dimensionadas e analisadas com suporte de estatístico experiente. Neste texto serão discutidos princípios para cálculos do tamanho de amostras aleatórias simples 4, A escolha da fração populacional que compõe a amostra do estudo implica que o pesquisador assuma certo grau de erro relacionado à estimativa dos parâmetros populacionais de cada variável, tal erro amostral é possível de quantificação, sendo inversamente proporcional ao tamanho da amostra 4,5, Para descrever a estimativa populacional representada por uma variável quantitativa (discreta ou contínua), deve-se dispor do desvio padrão populacional da variável, selecionar o nível de significância da estimativa e o erro amostral (em unidades da média) máximo tolerado ( Quadro 1 ) 2, Para descrever a estimativa populacional representada por uma variável qualitativa (nominal ou ordinal), deve-se dispor da frequência populacional de resultados da variável, selecionar o nível de significância da estimativa e o erro amostral (em percentual) máximo tolerado ( Quadro 1 ). Quando uma variável qualitativa não for dicotômica, o dimensionamento amostral deve ser considerado para a proporção de cada categoria que compõe a variável 4, Quando não se conhecer o desvio padrão ou as frequências populacionais da variável, e não se dispuser de dados semelhantes na literatura, deve-se realizar um pré-teste com 30-40 indivíduos e considerar o comportamento desse subgrupo como a estimativa populacional 2, Ainda, as fórmulas para cálculo do tamanho amostral pressupõem populações de tamanho ilimitado. Uma situação especial ocorre quando se estudam populações restritas (<10000 indivíduos), já que, nesses casos, cada unidade amostrada representa uma significativa fração do universo amostral finito. Nesses casos, as fórmulas podem ser ajustadas a partir de um fator de correção para populações finitas, minimizando a dimensão da amostra necessária ( Quadro 1 ) 2, Exemplo 1: Caso se objetivasse descrever as medidas de pressão arterial média de uma população de pacientes específica, que nunca tenha sido descrita anteriormente, e o erro tolerável fosse de ±5 mmHg, o tamanho amostral precisa se basear em uma expectativa do desvio padrão dos valores desse grupo. Caso um pré-teste com 30 pacientes evidenciasse um desvio padrão de 15 mmHg, o tamanho amostral baseado na fórmula do Quadro 1 seria: n=(1,96×15/5) 2 =34,6 pacientes Exemplo 2: Caso se objetivasse descrever a prevalência de insuficiência venosa nos membros inferiores, com um erro tolerável de ±5%, na população de pacientes obesos mórbidos de um ambulatório específico de obesidade que possui um volume de 315 pacientes (630 membros), o cálculo do tamanho amostral do estudo poderia se basear nos resultados de Seidel et al.6 que estimaram a proporção de 69,3% de membros acometidos. O cálculo do tamanho amostral para uma população finita baseia-se na fórmula do Quadro1 : n=/ =215,5 membros O cálculo amostral para comparação de subgrupos (testes de hipóteses) dentro de uma amostra depende do teste estatístico escolhido, das diferenças entre os grupos, da tolerância do pesquisador à detecção de diferenças quando elas não existem (erro tipo I) ou da falha na detecção de diferenças entre os subgrupos quando elas realmente existem (erro tipo II). As probabilidades associadas aos erros tipos I e II são convencionadas como α e β, e comumente, são adotados valores de 5% (bilateralmente) e 20%, mas outros valores podem ser utilizados de forma criteriosa ( Quadro 2 ) 1,2, Uma estratégia que permite a redução da variabilidade das medidas, aumentando a comparabilidade dos indivíduos em uma amostra, e, consequentemente, reduzindo a necessidade numérica amostral para a detecção de um fenômeno, é o pareamento (ou emparelhamento) das observações ( Quadro 2 ). Isso ocorre quando um mesmo indivíduo é observado em diferentes momentos (estudo longitudinal), ou submetido a medidas em diferentes locais do corpo, como a comparação de um tratamento no membro inferior direito versus o esquerdo, desde que se respeitem os limites éticos dessa comparação. Outra forma de emparelhamento mais elaborada é a escolha de indivíduos com as mesmas características: idade, gênero, etnia, classe social, entre outras variáveis que possam controlar a variabilidade individual. Nesses casos, a medida ocorre entre os pares, ao invés da comparação direta dos subgrupos 1, Exemplo 3: Caso se objetivasse comparar as medidas de fluxometria de dois membros de cães submetidos a dois diferentes procedimentos de revascularização arterial, e a diferença mínima tolerável para considerar um procedimento eficiente fosse de ±50 mL/min, seria necessário um estudo piloto que deveria indicar o desvio padrão das diferenças dos fluxos (p.ex.: 60 mL/min), o tamanho amostral baseado na fórmula do Quadro 2 seria: n= 2 =11,3 animais Exemplo 4: Caso se objetivasse comparar as taxas de cura de dois procedimentos cirúrgicos, sendo que o tradicional oferece 70% de cura e o procedimento em estudo devesse ser ao menos 10% superior ao convencional, o cálculo do tamanho amostral mínimo de um ensaio clínico deve ser baseado na fórmula do Quadro 2 : n= /(0,7-0,8) 2 =290,4 pacientes (cada grupo) Em pesquisas onde diversas variáveis forem importantes para análise do desfecho estudado, ou seja, não são apenas controle ou variáveis de ajuste, faz-se necessário cálculo do tamanho amostral para cada variável importante estudada. Testes de equivalência, de não-inferioridade e de concordância, requerem dimensionamentos amostrais próprios, distintos dos testes de diferenças de médias e de proporções comumente usados. Além disso, análises multivariadas, comparação de subgrupos com diferentes proporções numéricas, ou múltiplas comparações longitudinais, também envolvem maior complexidade do cálculo amostral. Todos esses itens ultrapassam o escopo deste texto 1,5,7-10, O cálculo amostral para estudos que envolvam a estimativa da correlação linear entre duas variáveis quantitativas depende exclusivamente do coeficiente de correlação linear ( Quadro 3 ). Exemplo 5: Caso se objetivasse estabelecer a correlação entre a medida de força muscular dos quadríceps e a distância máxima percorrida por pacientes com história de claudicação intermitente, o tamanho amostral poderia ser baseado no estudo de Pereira et al.11 que descreveu um coeficiente de correlação linear de 0,87. De acordo com a fórmula do Quadro 3 : n=4+ 2 =8,4 pacientes Estudos longitudinais (coortes prospectivas e ensaios clínicos), por necessitarem do seguimento dos pacientes em função do tempo, podem ser penitenciados pela saída, desistência, perda, morte ou exclusão do indivíduo do estudo. É recomendável a correção do cálculo da amostra inicial para prever essas ocorrências, usualmente, aumenta-se a amostra em até 30%. Os pacientes perdidos ( drop outs ) devem ser estudados criteriosamente quanto as suas razões para saída e se apresentam diferenças quanto às principais variáveis em relação aos remanescentes no estudo, a fim de identificar fatores ligados aos drop outs, Quando mais de 30% dos pacientes incluídos perdem o seguimento, pode haver comprometimento da representatividade da amostra, independentemente da suficiência numérica dos casos. Desde que as conclusões de um estudo sejam generalizáveis apenas à população amostrada, é possível que a repetição do estudo em outros centros possa apresentar resultados diferentes que expressem a realidade da nova população pesquisada. Tais resultados podem, inclusive, extrapolar os limites do intervalo de confiança do parâmetro estimado primariamente, sem significar necessariamente falta de validade interna de nenhum dos dois estudos. Esse também é um dos riscos de se utilizar resultados de outros pesquisadores para o cálculo do tamanho amostral de uma população diferente. A análise preliminar da primeira fração dos casos (pré-teste) é extremamente recomendável, torna mais confortável a estimativa da amostra necessária para cada realidade e previne constrangimentos analíticos ao final do estudo 12, Sempre que o tamanho da amostra do estudo for muito restrito (<30 medidas), é dificultada a análise de subgrupos e comprometido o desempenho dos testes estatísticos. Deve-se, contudo, ter cuidado adicional com o superdimensionamento amostral, que comumente ocorre quando se tem acesso a grandes bancos de dados informatizados. O aumento da amostra reduz os intervalos de confiança das estimativas e permite a detecção de diferenças entre subgrupos que, apesar de estatisticamente significantes, não possuem relevância clínica 3,12-14, Por fim, há diferentes fórmulas para o cálculo do tamanho amostral para testes estatísticos específicos, além das daqui expostas, dependendo do modelo matemático pressuposto, que podem ser facilmente obtidas na literatura ou mesmo na Internet 1,15,16, Há softwares gratuitos em português, como o intuitivo BioEstat, que possuem módulos para cálculos de tamanho de amostra 17, Entretanto, a suficiência amostral deve ser entendida como parte importante do planejamento metodológico do estudo, que precisa estar integrado à elaboração das hipóteses, desenho, técnicas de amostragem, análise e interpretação dos dados, para o sucesso da investigação.
Ver resposta completaQual a importância do aumento da amostra?
EDITORIAL Tamanho da amostra em estudos clínicos e experimentais Hélio Amante Miot Professor Assistente do Departamento de Dermatologia e Radioterapia da Faculdade de Medicina de Botucatu da Universidade Estadual Paulista (UNESP) – Botucatu (SP), Brasil Estudos investigativos clínico-epidemiológicos ou experimentais objetivam descrever fenômenos ou comparar o comportamento de variáveis em subgrupos de uma população. Para tanto, não se realiza o estudo de todo o universo populacional, usualmente porque não é acessível ou viável, porém, principalmente, porque não é necessário quando se dispõe de uma amostra representativa para a realização de inferências à população-alvo 1,2, O planejamento amostral da pesquisa determina o dimensionamento numérico e também a técnica de amostragem (coleta/seleção) dos elementos de um estudo. É fundamental na elaboração do projeto, e seus problemas podem comprometer a análise final dos dados e interpretação dos resultados. O planejamento amostral adequado depende do conhecimento básico da estatística do estudo e do conhecimento profundo do problema investigado, a fim de que se possa unir a significância estatística dos testes ao significado clínico dos resultados 1,3,4, A maior parte dos testes bioestatísticos pressupõe que a amostra estudada seja probabilisticamente representativa da população. Algumas amostras coletadas por conveniência, como a escolha de pacientes consecutivos de um ambulatório específico, podem não representar adequadamente toda a população do estudo. O pesquisador deve estar atento a possíveis vieses de seleção oriundos da disponibilidade de pacientes em amostragens consecutivas, já que a ampliação do tamanho amostral não corrige o efeito de amostras enviesadas. Além disso, estratégias de amostragens estratificadas não probabilísticas, por quotas, complexas (conglomerados, multiníveis), por resposta voluntária, por saturação de variáveis, tipo “bola de neve” ou com sistemática de coleta não aleatorizada devem ser desenhadas, dimensionadas e analisadas com suporte de estatístico experiente. Neste texto serão discutidos princípios para cálculos do tamanho de amostras aleatórias simples 4, A escolha da fração populacional que compõe a amostra do estudo implica que o pesquisador assuma certo grau de erro relacionado à estimativa dos parâmetros populacionais de cada variável, tal erro amostral é possível de quantificação, sendo inversamente proporcional ao tamanho da amostra 4,5, Para descrever a estimativa populacional representada por uma variável quantitativa (discreta ou contínua), deve-se dispor do desvio padrão populacional da variável, selecionar o nível de significância da estimativa e o erro amostral (em unidades da média) máximo tolerado ( Quadro 1 ) 2, Para descrever a estimativa populacional representada por uma variável qualitativa (nominal ou ordinal), deve-se dispor da frequência populacional de resultados da variável, selecionar o nível de significância da estimativa e o erro amostral (em percentual) máximo tolerado ( Quadro 1 ). Quando uma variável qualitativa não for dicotômica, o dimensionamento amostral deve ser considerado para a proporção de cada categoria que compõe a variável 4, Quando não se conhecer o desvio padrão ou as frequências populacionais da variável, e não se dispuser de dados semelhantes na literatura, deve-se realizar um pré-teste com 30-40 indivíduos e considerar o comportamento desse subgrupo como a estimativa populacional 2, Ainda, as fórmulas para cálculo do tamanho amostral pressupõem populações de tamanho ilimitado. Uma situação especial ocorre quando se estudam populações restritas (<10000 indivíduos), já que, nesses casos, cada unidade amostrada representa uma significativa fração do universo amostral finito. Nesses casos, as fórmulas podem ser ajustadas a partir de um fator de correção para populações finitas, minimizando a dimensão da amostra necessária ( Quadro 1 ) 2, Exemplo 1: Caso se objetivasse descrever as medidas de pressão arterial média de uma população de pacientes específica, que nunca tenha sido descrita anteriormente, e o erro tolerável fosse de ±5 mmHg, o tamanho amostral precisa se basear em uma expectativa do desvio padrão dos valores desse grupo. Caso um pré-teste com 30 pacientes evidenciasse um desvio padrão de 15 mmHg, o tamanho amostral baseado na fórmula do Quadro 1 seria: n=(1,96×15/5) 2 =34,6 pacientes Exemplo 2: Caso se objetivasse descrever a prevalência de insuficiência venosa nos membros inferiores, com um erro tolerável de ±5%, na população de pacientes obesos mórbidos de um ambulatório específico de obesidade que possui um volume de 315 pacientes (630 membros), o cálculo do tamanho amostral do estudo poderia se basear nos resultados de Seidel et al.6 que estimaram a proporção de 69,3% de membros acometidos. O cálculo do tamanho amostral para uma população finita baseia-se na fórmula do Quadro1 : n=/ =215,5 membros O cálculo amostral para comparação de subgrupos (testes de hipóteses) dentro de uma amostra depende do teste estatístico escolhido, das diferenças entre os grupos, da tolerância do pesquisador à detecção de diferenças quando elas não existem (erro tipo I) ou da falha na detecção de diferenças entre os subgrupos quando elas realmente existem (erro tipo II). As probabilidades associadas aos erros tipos I e II são convencionadas como α e β, e comumente, são adotados valores de 5% (bilateralmente) e 20%, mas outros valores podem ser utilizados de forma criteriosa ( Quadro 2 ) 1,2, Uma estratégia que permite a redução da variabilidade das medidas, aumentando a comparabilidade dos indivíduos em uma amostra, e, consequentemente, reduzindo a necessidade numérica amostral para a detecção de um fenômeno, é o pareamento (ou emparelhamento) das observações ( Quadro 2 ). Isso ocorre quando um mesmo indivíduo é observado em diferentes momentos (estudo longitudinal), ou submetido a medidas em diferentes locais do corpo, como a comparação de um tratamento no membro inferior direito versus o esquerdo, desde que se respeitem os limites éticos dessa comparação. Outra forma de emparelhamento mais elaborada é a escolha de indivíduos com as mesmas características: idade, gênero, etnia, classe social, entre outras variáveis que possam controlar a variabilidade individual. Nesses casos, a medida ocorre entre os pares, ao invés da comparação direta dos subgrupos 1, Exemplo 3: Caso se objetivasse comparar as medidas de fluxometria de dois membros de cães submetidos a dois diferentes procedimentos de revascularização arterial, e a diferença mínima tolerável para considerar um procedimento eficiente fosse de ±50 mL/min, seria necessário um estudo piloto que deveria indicar o desvio padrão das diferenças dos fluxos (p.ex.: 60 mL/min), o tamanho amostral baseado na fórmula do Quadro 2 seria: n= 2 =11,3 animais Exemplo 4: Caso se objetivasse comparar as taxas de cura de dois procedimentos cirúrgicos, sendo que o tradicional oferece 70% de cura e o procedimento em estudo devesse ser ao menos 10% superior ao convencional, o cálculo do tamanho amostral mínimo de um ensaio clínico deve ser baseado na fórmula do Quadro 2 : n= /(0,7-0,8) 2 =290,4 pacientes (cada grupo) Em pesquisas onde diversas variáveis forem importantes para análise do desfecho estudado, ou seja, não são apenas controle ou variáveis de ajuste, faz-se necessário cálculo do tamanho amostral para cada variável importante estudada. Testes de equivalência, de não-inferioridade e de concordância, requerem dimensionamentos amostrais próprios, distintos dos testes de diferenças de médias e de proporções comumente usados. Além disso, análises multivariadas, comparação de subgrupos com diferentes proporções numéricas, ou múltiplas comparações longitudinais, também envolvem maior complexidade do cálculo amostral. Todos esses itens ultrapassam o escopo deste texto 1,5,7-10, O cálculo amostral para estudos que envolvam a estimativa da correlação linear entre duas variáveis quantitativas depende exclusivamente do coeficiente de correlação linear ( Quadro 3 ). Exemplo 5: Caso se objetivasse estabelecer a correlação entre a medida de força muscular dos quadríceps e a distância máxima percorrida por pacientes com história de claudicação intermitente, o tamanho amostral poderia ser baseado no estudo de Pereira et al.11 que descreveu um coeficiente de correlação linear de 0,87. De acordo com a fórmula do Quadro 3 : n=4+ 2 =8,4 pacientes Estudos longitudinais (coortes prospectivas e ensaios clínicos), por necessitarem do seguimento dos pacientes em função do tempo, podem ser penitenciados pela saída, desistência, perda, morte ou exclusão do indivíduo do estudo. É recomendável a correção do cálculo da amostra inicial para prever essas ocorrências, usualmente, aumenta-se a amostra em até 30%. Os pacientes perdidos ( drop outs ) devem ser estudados criteriosamente quanto as suas razões para saída e se apresentam diferenças quanto às principais variáveis em relação aos remanescentes no estudo, a fim de identificar fatores ligados aos drop outs, Quando mais de 30% dos pacientes incluídos perdem o seguimento, pode haver comprometimento da representatividade da amostra, independentemente da suficiência numérica dos casos. Desde que as conclusões de um estudo sejam generalizáveis apenas à população amostrada, é possível que a repetição do estudo em outros centros possa apresentar resultados diferentes que expressem a realidade da nova população pesquisada. Tais resultados podem, inclusive, extrapolar os limites do intervalo de confiança do parâmetro estimado primariamente, sem significar necessariamente falta de validade interna de nenhum dos dois estudos. Esse também é um dos riscos de se utilizar resultados de outros pesquisadores para o cálculo do tamanho amostral de uma população diferente. A análise preliminar da primeira fração dos casos (pré-teste) é extremamente recomendável, torna mais confortável a estimativa da amostra necessária para cada realidade e previne constrangimentos analíticos ao final do estudo 12, Sempre que o tamanho da amostra do estudo for muito restrito (<30 medidas), é dificultada a análise de subgrupos e comprometido o desempenho dos testes estatísticos. Deve-se, contudo, ter cuidado adicional com o superdimensionamento amostral, que comumente ocorre quando se tem acesso a grandes bancos de dados informatizados. O aumento da amostra reduz os intervalos de confiança das estimativas e permite a detecção de diferenças entre subgrupos que, apesar de estatisticamente significantes, não possuem relevância clínica 3,12-14, Por fim, há diferentes fórmulas para o cálculo do tamanho amostral para testes estatísticos específicos, além das daqui expostas, dependendo do modelo matemático pressuposto, que podem ser facilmente obtidas na literatura ou mesmo na Internet 1,15,16, Há softwares gratuitos em português, como o intuitivo BioEstat, que possuem módulos para cálculos de tamanho de amostra 17, Entretanto, a suficiência amostral deve ser entendida como parte importante do planejamento metodológico do estudo, que precisa estar integrado à elaboração das hipóteses, desenho, técnicas de amostragem, análise e interpretação dos dados, para o sucesso da investigação.
Ver resposta completa