302.10 Explorando subconjuntos dos dados
Importe novamente o arquivovespas.txt
para um objeto chamado vespas
.
A função aggregate
divide os dados em subconjuntos, computa estatísticas descritivas (ie. média, desvio-padrão etc) para cada um deles e retorna o resultado em um data.frame formatado de forma conveniente. Examine o help da função aggregate
para você se familiarizar.
Note que a função calcula estatísticas descritivas tanto para uma única variável (Ex1) ou para mais de uma ao mesmo tempo (Ex2):
Ex2: aggregate(cbind(Flores, Sementes, Vespas)~Arvore, data=vespas, FUN=mean)Ex1: aggregate(Flores~Arvore, data=vespas, FUN=mean)
Com a função aggregate
, calcule a média das variáveis Vespas, Sementes e Flores (nesta ordem) para as árvores A e B. Salve o resultado em um objeto chamado
medias
.
Com a função aggregate
, calcule o desvio-padrão das variáveis Vespas, Sementes e Flores (nesta ordem) para as árvores A e B. Salve o resultado em um objeto chamado desvpad
.
Com a função aggregate
, calcule os valores mínimo, 1º quartil, mediana, 3º quartil e máximo da variável Vespas para as árvores A e B. Salve o resultado em um objeto chamado vespas.quartil
. DICA: use a função quantile
.
Repita o mesmo exercício para a variável Sementes e salve o resultado em um objeto chamado sementes.quartil
.
Use os resultados de vespas.quartil
e sementes.quartil
para desenhar à mão gráficos box-plot comparando o número de Vespas e Sementes nas duas árvores (OBS: faça gráficos separados para as variáveis Vespas e Sementes). Entregue os gráficos no início da próxima aula.