Estatística

Aula

Redução dos dados: os diferentes tipos de amostragem

, editado , Comment regular icon0 comments

Passamos pela parte de coleta de dados no curso, vamos ver agora como reduzir os dados!

Edit Article

Introdução

Até o momento na matéria, vimos os conceitos relacionados à coleta de dados: o que coletar e os signifados por trás de cada coleta.

Entraremos em um novo campo dentro da estatística, que diz respeito à redução dos dados. Este campo está preocupado com a incapacidade do ser humano lidar com toda a população de dados disponíveis. Por motivos econômicos, temporais e/ou físicos nos restringimos a analisar apenas amostras de dados e, dentro dessas amostras, reduzir mais ainda, para apenas mantermos os dados relevantes.

Ad

População e amostra

> Ao conjunto de entes portadores de, pelo menos, uma característica comum denominamos

população estatística ou universo estatístico.

Como em qualquer estudo estatístico, temos em mente pesquisar uma ou mais características dos elementos de alguma população, esta característica deve estar perfeitamente definida. E isto se dá quando, considerado um elemento qualquer, podemos afirmar, sem ambiguidade, se esse elemento pertence ou não à população. É necessário, pois, existir um critério de constituição da população, válido para qualquer pessoa, no tempo ou no espaço. Por isso, quando pretendemos fazer uma pesquisa entre os alunos das escolas de 1 o grau , precisamos definir quais são os alunos que formam o universo: os que atualmente ocupam as carteiras das escolas, ou devemos incluir também os que já passaram pela escola? É claro que a solução do problema vai depender de cada caso em particular.

Na maioria das vezes, por impossibilidade ou inviabilidade econômica ou temporal, limitamos as observações referentes a uma determinada pesquisa a apenas uma parte da população. A essa parte proveniente da população em estudo denominamos amostra.

“Uma amostra é um subconjunto finito de uma população”

- Seu professor Leon

É necessário garantir que a amostra seja representativa da população, isto é, a amostra deve possuir as mesmas características básicas da população, no que diz respeito ao fenômeno que desejamos pesquisar. É preciso, pois, que a amostra ou as amostras que vão ser usadas sejam obtidas por processos adequados.

O que é amostragem

Existe uma técnica especial - amostragem - para recolher amostras, que garante, tanto quanto possível, o acaso na escolha.

Dessa forma, cada elemento da população passa a ter a mesma chance de ser escolhido, o que garante à amostra o caráter de representatividade, e isto é muito importante, pois, como vimos, nossas conclusões relativas à população vão estar baseadas nos resultados obtidos nas amostras dessa população.

Assim, com uma boa amostra, podemos inferir ou estimar parâmetros populacionais com base em amostras de dados. Como os parâmetros verdadeiros de uma população (como a média, variância ou proporção) são geralmente desconhecidos, os estimadores nos permitem aproximar esses valores utilizando informações de uma amostra.

Tipos de Estimadores

Existem diversos estimadores, dependendo do parâmetro que se deseja estimar. Alguns exemplos comuns são:

Média amostral como estimador da média populacional

\[ \bar{X} = \frac{1}{n} \sum_{i=1}^{n} X_i \]

Onde 𝑋𝑖 são os valores da amostra e n é o tamanho da amostra.

Variância amostral (𝑠2) como estimador da variância populacional (𝜎2)

\[ s^2 = \frac{1}{n-1} \sum_{i=1}^{n} (X_i - \bar{X})^2 \]

Essa fórmula divide por 𝑛 -1 (correção de Bessel) para produzir um estimador não-viesado.

Proporção amostral (𝑝) como Estimador da proporção populacional (𝑝)

\[ \hat{p} = \frac{\text{número de sucessos na amostra}}{n} \]

Sendo p o número de sucessos na amostra.

Ad

Propriedades dos Estimadores

Nem todos os estimadores são iguais, e os estatísticos têm várias propriedades que buscam em um bom estimador. As principais propriedades incluem:

Viesado (Bias)

Um estimador é não-viesado (ou insesgado) se, em média, ele fornecer o valor exato do parâmetro populacional. Isso significa que o valor esperado do estimador é igual ao parâmetro.

Consistência

Um estimador é consistente se, à medida que o tamanho da amostra aumenta, ele tende a se aproximar do valor verdadeiro do parâmetro populacional. Ou seja, quanto maior a amostra, mais precisa será a estimativa.

Eficiência

Um estimador é eficiente se tiver a menor variância possível em comparação com outros estimadores para o mesmo parâmetro. Isso significa que ele tende a ser o mais preciso entre os estimadores possíveis.

Suficiência

Um estimador é suficiente se ele utiliza toda a informação relevante presente na amostra sobre o parâmetro que está sendo estimado.

Tipos de amostragens

Amostragem casual ou aleatória simples

Este tipo de amostragem é equivalente a um sorteio lotérico.

Exemplo

Vamos obter uma amostra representativa para a pesquisa da estatura de noventa alunos de uma escola: numeramos os alunos de 01 a 90 e sorteamos 9 desses alunos, neste caso, representando 10% da população.

Amostragem proporcional estratificada

Muitas vezes a população se divide em subpopulações - estratos.

Como é provável que a variável em estudo apresente, de estrato em estrato, um comportamento heterogêneo e, dentro de cada estrato, um comportamento homogêneo, convém que o sorteio dos elementos da amostra leve em consideração tais estratos.

É exatamente isso que fazemos quando empregamos a amostragem proporcional estratificada, que, além de considerar a existência dos estratos, obtém os elementos da amostra proporcional ao número de elementos dos mesmos.

Exemplo

Supondo que há noventa alunos, onde 54 são meninos e 36 são meninas. Para obter a amostra proporcional estratificada de 10% da população, devemos separar o estratos. 10% de 54 meninos, são 5,4 ou 5 meninos e 10% de 36 meninas são 3,6 ou 4 meninas.

Amostragem sistemática

Q uando os elem entos da população já se acham ordenados, não há necessidade de construir o sistema de referência. São exemplos os prontuários m édicos de um hospital, os prédios de uma rua, as linhas de produção etc. Nestes casos, a seleção dos elem entos que constituirão a amostra pode ser feita por um sistem a imposto pelo pesquisador. A esse tipo de amostragem denominamos sistemática.

Exemplo

No caso de uma linha de produção, podem os funcionários, a cada dez itens produzidos, retirar um item para pertencer a uma amostra da produção diária. N este caso, estaríamos fixando o tamanho da amostra em 10% da população.

Exercícios

1) Uma escola de 1º grau abriga 124 alunos. Explique como obter uma amostra representativa correspondendo a 15% da população.

2) Em uma escola há 800 alunos de diferentes anos. As turmas possuem tamanhos diferentes. Explique como obter uma amostra de 100 alunos.

Ad

3) Uma população encontra-se dividida em três estratos, com tamanhos, respectivamente: n1

= 40, n2 = 100 e n3 = 60. Sabendo que, ao ser realizada uma amostragem estratificada proporcional, doze elementos da amostra foram retirados do 3o estrato, determine o número total de elementos da amostra.

4) Mostre como seria possível retirar uma amostra de 32 elementos de uma população ordenada formada por 2.432 elementos. Na ordenação geral, qual dos seguintes elementos seria escolhido para pertencer à amostra, sabendo-se que o elemento de ordem 1.420 a ela pertence? 1.648º, 290º, 725º, 2.025º, 1.120º.

Gabarito

3) Amostra tem tamanho 40.

4) O elemento de ordem 1.648 pertence à amostra