110.01 Organizando e analisando dados do coleguinha
Você foi convidado para colaborar em um projeto de seu colega de laboratório e ele te mandou 4 planilhas em csv com os dados de coletas de campo dele. Baixe os arquivos no diretório de trabalho e faça a leitura deles em objetos na sua sessão de trabalho:
O estudo do seu colega analisa o peso de machos e fêmeas (Sex
: M
, F
) de 3 espécies de mamíferos (Species
: DS
, DM
, DO
) em alguns locais (plot
). Três destas planilhas estão organizadas por espécie (nome da planilha é o código da espécie) e uma delas está organizada por local (o nome da planilha é o código do local).
Sua missão é:
- Organizar e combinar as diferentes planilhas de dados no R:
- Padronizar nomes de colunas: mantenha os nomes originais, mas com todas letras minúsculas, e nomes com mais de uma palavra separados por ponto.
- Checar valores faltantes e excluir linhas com
NA
ou espaços vazios. - Combinar as 4 planilhas em um objeto único chamado
limpo
contendo as seguintes colunas nesta ordem:date.collected
,plot
,sex
,weight
,species
. - Consertar classes de objetos nas planilhas:
- Verifique números armazenados como texto. Para colunas de natureza numérica deve se excluir o texto grep , mas manter os números (ou seja, não exclua estas linhas)!
- A variável
plot
deve ser tratada como numérica! - As variáveis categóricas (
sex
especies
) devem ser transformadas em fatores, com códigos dos fatores em letras maiúsculas (garanta que o código deM
venha antes doF
e que os códigos de espécies estejam ordenados por ordem alfabetica). - Datas deve ser armazenadas como classe
Date
. - Analisar os dados criando um modelo linear do peso dos animais em função da espécie. Salvar este modelo em um arquivo chamado
modelo
.
grep as funções da família grep
busca padrões de caracteres e faz substituições, veja o help da função, ela pode te ajudar!
OBS: Os dados foram baixados e adaptados de um exercício do roteiro sobre organização de planilhas do Data Carpentry .