110.01 Organizando e analisando dados do coleguinha
Você foi convidado para colaborar em um projeto de seu colega de laboratório e ele te mandou 4 planilhas em csv com os dados de coletas de campo dele. Baixe os arquivos no diretório de trabalho e faça a leitura deles em objetos na sua sessão de trabalho:
O estudo do seu colega analisa o peso de machos e fêmeas (Sex: M, F) de 3 espécies de mamíferos (Species: DS, DM, DO) em alguns locais (plot). Três destas planilhas estão organizadas por espécie (nome da planilha é o código da espécie) e uma delas está organizada por local (o nome da planilha é o código do local).
Sua missão é:
- Organizar e combinar as diferentes planilhas de dados no R:
- Padronizar nomes de colunas: mantenha os nomes originais, mas com todas letras minúsculas, e nomes com mais de uma palavra separados por ponto.
- Checar valores faltantes e excluir linhas com
NAou espaços vazios. - Combinar as 4 planilhas em um objeto único chamado
limpocontendo as seguintes colunas nesta ordem:date.collected,plot,sex,weight,species. - Consertar classes de objetos nas planilhas:
- Verifique números armazenados como texto. Para colunas de natureza numérica deve se excluir o texto grep , mas manter os números (ou seja, não exclua estas linhas)!
- A variável
plotdeve ser tratada como numérica! - As variáveis categóricas (
sexespecies) devem ser transformadas em fatores, com códigos dos fatores em letras maiúsculas (garanta que o código deMvenha antes doFe que os códigos de espécies estejam ordenados por ordem alfabetica). - Datas deve ser armazenadas como classe
Date. - Analisar os dados criando um modelo linear do peso dos animais em função da espécie. Salvar este modelo em um arquivo chamado
modelo.
grep as funções da família grep busca padrões de caracteres e faz substituições, veja o help da função, ela pode te ajudar!
OBS: Os dados foram baixados e adaptados de um exercício do roteiro sobre organização de planilhas do Data Carpentry .
notas em linguagem R