Tabela de conteúdos
BIE5782 - Uso da Linguagem R Para Análise de Dados em Ecologia
Bem vido(a). Aqui você encontrará a programação de nossa disciplina, ministrada em maio de 2008 no Instituto de Biocências da USP, e outras informações importantes. Além disto, há algumas atividades prévias a cumprir antes do início das aulas.
Informações Gerais
Disciplina oferecida pelo Programa de Pós-Graduação em Ecologia da Universidade de São Paulo
Equipe
Coordenador: Prof. Paulo Inácio K. L. Prado, IB-USP (prado at ib ponto usp ponto br, fone 11-30917599)
Participantes:
- Prof. Alexandre Adalardo de Oliveira, IB-USP(adalardo at usp ponto br)
- Prof. Rodrigo Augusto Santinelo Pereira, FFCLRP-USP (raspereira at yahoo ponto com ponto br)
- Prof. João Luís Ferreira Batista, ESALQ-USP (parsival at usp ponto br)
Período e Horários
- Disciplina condensada, 05 a 16 de maio de 2008.
- Aulas teóricas de segunda a sexta pelas manhãs, das 8:30 às 12:30 (sextas das 8:00 às 12:00).
- Tardes reservadas para resolução de exercícios.
- No último dia da disciplina (16/05) teremos também aula teórica pela tarde, das 14:00 às 17:00.
Locais das aulas
As aulas ocorrerão em diferentes salas do Instituto de Biociências da USP, esteja atento(a) ao programa abaixo.
- AG Botânica: Auditório do Departamento de Botânica
- Minas 3: Auditório 3 do Prédio “Minas” (Em frente à entrada do Depto de Botânica)
- Anf Admin: Anfiteatro do Prédio da Administração
- Auditório 2: auditório 2 do Centro Didático, no térreo.
Programação
Data | Período | Local | Assunto | Professor |
---|---|---|---|---|
05/05 | 8:30 - 12:30 | AG Botânica | Filosofia e histórico da linguagem R, Introdução à linguagem R | Paulo |
06/05 | 8:30 - 12:30 | AG Botânica | Funções matemáticas e estatísticas no R | Paulo |
07/05 | 8:30 - 12:30 | Minas 3 | Leitura e Manipulação de Dados | Paulo |
08/05 | 8:30 - 12:30 | AG Botânica | Análise Exploratória de Dados: estatística descritiva e gráficos | Rodrigo |
09/05 | 8:00 - 12:00 | Anf Admin | Introdução a Modelos Lineares: operações matriciais | Rodrigo |
12/05 | 8:30 - 12:30 | AG Botânica | Noções de Programação em Linguagem R: construção de funções simples | Alexandre |
13/05 | 8:30 - 12:30 | AG Botânica | Modelos Lineares | Rodrigo |
14/05 | 8:30 - 12:30 | Minas 3 | Modelos Lineares | Rodrigo |
15/05 | 8:30 - 12:30 | AG Botânica | Exercícios e discussão modelos | Paulo e Alexandre |
16/05 | 8:30 - 12:00 | Anf Admin | Simulação e Reamostragem | Alexandre |
16/05 | 14:30 - 17:00 | Auditório 2 | Tira-dúvidas, avaliação da disciplina | Paulo e Alexandre |
Material de Apoio
Slides das Aulas
Códigos Apresentados em Aula
IMPORTANTE: apague a extensão pdf antes de usar
- Exemplo de ANCOVA (seleção de modelos). Usa conjunto de dados "egrandis.csv"
Exercícios
Soluções dos Exercícios
IMPORTANTE: apague a extensão pdf antes de usar
Dados e Outros
- Del rigor de la ciencia, uma vinheta sobre modelos, por J.L. Borges.
Bibliografia Básica
Livros
William N. Venables and Brian D. Ripley. Modern Applied Statistics with S. Fourth Edition. Springer, New York, 2002.
Conhecido na comunidade R como “The Book”, é a referência básica do usuário. Seu pacote companheiro é o MASS
1), que faz parte da instalação básica do R. Visite o site do livro para atualizações, exercícios e muito mais.
John Fox. An R and S-Plus Companion to Applied Regression. Sage Publications, Thousand Oaks, CA, USA, 2002.
Excelente livro sobre regressão linear, e uma ótima introdução à construção de modelos no R. O pacote companheiro, car
, tem ótimas funções para diagnóstico de regressões. Visite também o site do livro.
John Verzani. Using R for Introductory Statistics. Chapman & Hall/CRC, Boca Raton, FL, 2005. Derivado de manual disponível gratuitamente no site do autor, esta é uma das melhores introduções à linguagem para principiantes. Muito didático e com ótimos exercícios. Veja também o site do livro, e o pacote UsingR
.
Crawley, M. J. Statistical Computing – An Introduction to Data Analysis Using S-Plus. New York: Wiley, 2002. Um livro muito completo e feito por um ecólogo, para ensinar estatística e a linguagem. Referência obrigatória para pessoas da área. Veja também o site do livro.
Documentação On Line
NOTA: Selecionamos aqui três manuais on-line que nos parecem boas introduções. Há muito mais na seção Contributed Documentation do site do R.
Venables, W.; Smith, D.M; & R Development Team An Introduction to R. Manual online. Manual oficial de introdução ao R.
Carlos Alzola and Frank E. Harrell An Introduction to S and the Hmisc and Design Libraries” O Pacote Hmisc veio do S-Plus, e tem várias funções muito úteis para manipulação e análise exploratória de dados. O manual é extenso e é uma referência muito completa sobre a linguagem S.
Petra Kuhnert and Bill Venables An Introduction to R: Software for Statistical Modelling & Computing. Apostila de 360 de curso de Introdução ao R, além dos scripts de aula e conjuntos de dados.
Atividades Preparatórias
Explore a Página Oficial do R
Esta é a referência básica para usuários de R, que inclui programas para download, listas de discussão, e muita documentação e ajuda: http://www.r-project.org/.
Explore as seções, começando pelas FAQ. Leia atentamente a seção 2 (R Basics) das FAQ.
A página tem uma grande lista de documentação, na seção “Documentation”. Há um wiki em construção, e ainda um pouco irregular, mas com boas seções, como a de dicas. Além disso, há excelentes manuais introdutórios feitos por vários voluntários na seção de "Contributed documentation".
Instale o R em seu Computador de Trabalho
Ao fim de cada aula teórica você receberá uma lista de exercícios que serão discutidos na aula seguinte. Por isso, providencie um computador de trabalho e instale o R nele.
Na página principal do R clique no link para o CRAN (o que é isto? veja no wiki!), e escolha o repositório mais próximo de você para baixar arquivos de instalação.
Siga as instruções das FAQS para baixar e instalar a versão mais recente do R para seu sistema operacional.
Vá à seção de pacotes adicionais do R, que te enviará para uma lista e breve descrição dos pacotes disponíveis para baixar. Nela você pode ter uma idéia da quantidade e diversidade de aplicações que a comunidade de usuários do R já desenvolveu. Uma visão temática destes pacotes é fornecida nas “Task Views”, cujo link está na página de pacotes.
Veja a Task view “Environmetrics” , que descreve as aplicações disponíveis para ecologia. Escolha um dos pacotes e instale em seu computador.
Familiarize-se com o R
Abra o R em seu computador. Você verá um prompt
de comando em forma de sinal de maior (>
). Digite no prompt
cada linha do código abaixo e tecle enter
para executar. Cuidado com erros de digitação, que possivelmente gerarão erros de sintaxe, o que resultará em uma mensagem de erro.
Tente inferir o que cada comando faz a partir do resultado obtido, mas não se preocupe com detalhes. O objetivo é apenas familiarizar-se com o ambiente do R.
Discutiremos este tutorial na primeira aula.
area <- c(303, 379, 961, 295, 332, 47, 122, 11, 53, 2749) riqueza <- c(3, 10, 20, 7, 8, 4, 8, 3, 5, 23) area riqueza summary(area) summary(riqueza) mean(x=area) varea <- var(area) varea sqrt(varea) sd(x=area) mean(riqueza) var(riqueza) sd(riqueza) plot(x=area, y=riqueza, xlab="Area (ha)", ylab="Número de Espécies") modelo1 <- lm(riqueza~area) summary(modelo1) previsto <- fitted(modelo1) riqueza - previsto residuals(modelo1) par(mfrow=c(2,2)) plot(modelo1) par(mfrow=c(1,1)) plot(x=area, y=riqueza, xlab="Area (ha)", ylab="Número de Espécies") abline(modelo1) plot(x=area, y=riqueza, xlab="Log Area (ha)", ylab="Log Número de Espécies", log="xy") modelo2 <- lm(log(riqueza,base=10)~log(area,base=10)) summary(modelo2) par(mfrow=c(2,2)) plot(modelo2) par(mfrow=c(1,1)) plot(area, riqueza, xlab="Log Area (ha)", ylab="Log Número de Espécies", log="xy") abline(modelo2) # O que este comando faz? ## Fim!