Introdução
Como já dito na aula anterior, a estatística tem como objetivo a coleta, a redução, a análise e a modelagem dos dados. Ao procurar respostas para uma indagação propostas, você realiza uma pesquisa. Independente da sua área ou do procedimento de pesquisa (pesquisa de campo ou fonte de papel) ou até da sua abordagem (quantitativa ou qualitativa), serão coletados dados. [1]
O uso da estatística
Quando começamos um novo projeto geralmente queremos definir um modelo para responder uma pergunta. Esta pergunta pode ser:
Ad
- Contratar ou não uma pessoa?
- Qual o valor que devemos pagar em um produto?
- Qual a doença do paciente?
Devemos então definir o que devemos estudar para responder essas perguntas. Neste caso, veremos todas as variáveis possíveis que irão influenciar a resposta. A partir da definição das variáveis, vamos coletar os dados sobre ela. Logo após a coleta, podemos remover dados que são viciados (por exemplo, se vamos avaliar o quanto devemos pagar por um jogador de futebol, devemos considerar toda as partidas até os amistosos para avaliar ele?). Com esses dados agora corrigidos, vamos fazer a análise de cada variável, por exemplo, verificando se 38° é considerado muito acima do normal ou pouco para um pessoa doente. Por último, temos a modelagem de dados, que irá criar uma equação que responde a pergunta de fato.
Variável
Para exemplificar, imagine que neste momento um médico gostaria de estudar os batimentos cardíacos de um paciente e gostaria de saber se ele tem ou não uma doença. Faz uma bateria de perguntas:
- Você se exercita regularmente?
- Qual seu nível de colesterol?
- Quantos filhos você tem?
- Quanto você pesa?
- O que normalmente você come no almoço?
- ...
São diversas perguntas que cada médico acha relevante e suas respostas podem representar correlações com a doença estudada. Cada pergunta neste caso representa uma VARIÁVEL, a variável refere-se ao fenômeno a ser pesquisado. Denomina-se variável o campo de variação de cada tipo de dado a ser pesquisado. As variáveis estudas podem ser: [1]
Independente
É aquela que influencia, determina ou afeta uma variável.
Dependente
É aquela que será explicada, em função de ser influenciada, afetada pela variável independente.
No exemplo, a doença cardíaca é a variável dependente estudada que DEPENDE das seguintes variáveis independentes: quantidade de exercícios, nível de colesterol etc...
Variáveis também podem ser classificadas em: [3]
Qualitativa
São as características que não possuem valores quantitativos, mas, ao contrário, são definidas por várias categorias, ou seja, representam uma classificação dos indivíduos
Nominal
Não existe ordenação dentre as categorias. Exemplos: sexo, cor dos olhos, fumante/não fumante, doente/sadio;
Ordinal
Existe uma ordenação entre as categorias. Exemplos: escolaridade (1o, 2o, 3o graus), estágio da doença (inicial, intermediário, terminal), mês de observação (janeiro, fevereiro,..., dezembro).
Quantitativa
Traduz em números as opiniões e informações para serem classificadas e analisadas.
Discreta
Características mensuráveis que podem assumir apenas um número finito ou infinito contável de valores e, assim, somente fazem sentido valores inteiros. Geralmente são o resultado de contagens. Exemplos: número de filhos, número de bactérias por litro de leite, número de cigarros fumados por dia;
Contínua
Características mensuráveis que assumem valores em uma escala contínua (na reta real), para as quais valores fracionais fazem sentido. Usualmente devem ser medidas através de algum instrumento. Exemplos: peso (balança), altura (régua), tempo (relógio), pressão arterial, idade.
Ad
Resumo
As distinções são menos rígidas do que a descrição acima insinua. Uma variável originalmente quantitativa pode ser coletada de forma qualitativa. Por exemplo, a variável idade, medida em anos completos, é quantitativa (contínua); mas, se for informada apenas a faixa etária (0 a 5 anos, 6 a 10 anos, etc...), é qualitativa (ordinal). Outro exemplo é o peso dos lutadores de boxe, uma variável quantitativa (contínua) se trabalhamos com o valor obtido na balança, mas qualitativa (ordinal) se o classificarmos nas categorias do boxe (peso-pena, peso-leve, peso-pesado, etc.). [3]
Outro ponto importante é que nem sempre uma variável representada por números é quantitativa.
O número do telefone de uma pessoa, o número da casa, o número de sua identidade. Às vezes o sexo do indivíduo é registrado na planilha de dados como 1 se macho e 2 se fêmea, por exemplo. Isto não significa que a variável sexo passou a ser quantitativa! [3]
O esquema abaixo serve como resumo para entender uma variável:
Gráficos
Para o ser humano, a melhor forma de passar informação é visualmente.
> Os gráficos são um método efetivo de comunicação, uma vez que tiram partido efetivo dos mecanismos cognitivos, particularmente da percepção. A preferência por gráficos na comunicação de informação, em detrimento a outras formas não pictóricas (tabelas de números, lista de proposições etc.), pode ser explicada pelo fato de que a apresentação pictórica é, visualmente, mais prazerosa. [5]
Por motivos citados acima, há de se estudar formas diferentes de gráficos a fim de nos comunicarmos e entendermos melhor como cada variável se comporta. Os tipos gráficos mais conhecidos são:
Gráfico de barras
Um gráfico de barras exibe dados com bar discreto. A altura representa a quantidade de dados. Bastante utilizado com variáveis qualitativas por separar cada elemento.
Gráfico de decomposição em setores (gráfico de pizza)
Destina-se a representar a composição, usualmente em porcentagem, de partes de um todo. Por este motivo, também é utilizado para variáveis qualitativas
Histograma
Histograma é uma ferramenta de análise e representação de dados quantitativos, é normalmente um gráfico de barras verticais, agrupados em classes de frequência de uma massa de medições. A diferença entre um histograma e um gáfico de barras deve-se ao facto de que as barras de un histograma são intervalos e as barras de un gráfico podem ter una só valor de variavel por cada barra. [6] Por conseguir representar intervalos, é bastante utilizado em variáveis quantitativas.
Gráfico de dispersão
O gráfico de dispersão utiliza coordenadas cartesianas para exibir valores de um conjunto de dados. Os dados são exibidos como uma coleção de pontos. Por este motivo, é utilizado em variáveis quantitativas.
Ad
Mais gráficos com exemplos podem ser vistos aqui
Exercício
1) Classifique as seguintes variáveis
- tempo de vida de uma placa-mãe.
- tipo sanguíneo
- raça
- produção de amortecedores de uma indústria em um período de dois anos
- minutos
- produção de mel das caixas de um apiário
- religião
- estado civil
- número de pessoas na fila de um banco
- número de produtores associados a uma cooperativa
Respostas
- Quantitativa Contínua
- Qualitativa Nominal
- Qualitativa Nominal
- Quantitativa Discreta
- Quantitativa Contínua
- Quantitativa Contínua
- Qualitativa Nominal
- Qualitativa Nominal
- Quantitativa Discreta
- Quantitativa Discreta
Referências
[1] RODRIGUES, William Costa et al. Metodologia científica. Faetec/IST. Paracambi, p. 2-20, 2007.
[2] BUSSAB, Wilton de O.; MORETTIN, Pedro A. Estatística básica. Saraiva, 2017.
[3] http://leg.ufpr.br/~silvia/CE055/node8.html
[4] DA ESTATÍSTICA, CONCEITOS E. IMPORTÂNCIA. TIPOS DE VARIÁVEIS. Cada um de nós tem uma grande responsabilida-de: as escolhas que fizermos por nós e pelos nos-sos farão grande diferença no futuro. Com essa visão, o Centro Universitário Cesumar assume o compromisso de democratizar o conhe, p. 30.
[5] CAZORLA, Irene Mauricio et al. A relação entre a habilidade viso-pictórica e o domínio de conceitos estatísticos na leitura de gráficos. 2002.
[6] http://wiki.ued.ipleiria.pt/wikiEducacao/index.php/Histograma
— Kommentare0
Sei der erste der kommentiert