Bem vido(a). Aqui você encontrará a programação de nossa disciplina, ministrada em maio de 2008 no Instituto de Biocências da USP, e outras informações importantes. Além disto, há algumas atividades prévias a cumprir antes do início das aulas.
Disciplina oferecida pelo Programa de Pós-Graduação em Ecologia da Universidade de São Paulo
Coordenador: Prof. Paulo Inácio K. L. Prado, IB-USP (prado at ib ponto usp ponto br, fone 11-30917599)
Participantes:
As aulas ocorrerão em diferentes salas do Instituto de Biociências da USP, esteja atento(a) ao programa abaixo.
Data | Período | Local | Assunto | Professor |
---|---|---|---|---|
05/05 | 8:30 - 12:30 | AG Botânica | Filosofia e histórico da linguagem R, Introdução à linguagem R | Paulo |
06/05 | 8:30 - 12:30 | AG Botânica | Funções matemáticas e estatísticas no R | Paulo |
07/05 | 8:30 - 12:30 | Minas 3 | Leitura e Manipulação de Dados | Paulo |
08/05 | 8:30 - 12:30 | AG Botânica | Análise Exploratória de Dados: estatística descritiva e gráficos | Rodrigo |
09/05 | 8:00 - 12:00 | Anf Admin | Introdução a Modelos Lineares: operações matriciais | Rodrigo |
12/05 | 8:30 - 12:30 | AG Botânica | Noções de Programação em Linguagem R: construção de funções simples | Alexandre |
13/05 | 8:30 - 12:30 | AG Botânica | Modelos Lineares | Rodrigo |
14/05 | 8:30 - 12:30 | Minas 3 | Modelos Lineares | Rodrigo |
15/05 | 8:30 - 12:30 | AG Botânica | Exercícios e discussão modelos | Paulo e Alexandre |
16/05 | 8:30 - 12:00 | Anf Admin | Simulação e Reamostragem | Alexandre |
16/05 | 14:30 - 17:00 | Auditório 2 | Tira-dúvidas, avaliação da disciplina | Paulo e Alexandre |
IMPORTANTE: apague a extensão pdf antes de usar
IMPORTANTE: apague a extensão pdf antes de usar
William N. Venables and Brian D. Ripley. Modern Applied Statistics with S. Fourth Edition. Springer, New York, 2002.
Conhecido na comunidade R como “The Book”, é a referência básica do usuário. Seu pacote companheiro é o MASS
1), que faz parte da instalação básica do R. Visite o site do livro para atualizações, exercícios e muito mais.
John Fox. An R and S-Plus Companion to Applied Regression. Sage Publications, Thousand Oaks, CA, USA, 2002.
Excelente livro sobre regressão linear, e uma ótima introdução à construção de modelos no R. O pacote companheiro, car
, tem ótimas funções para diagnóstico de regressões. Visite também o site do livro.
John Verzani. Using R for Introductory Statistics. Chapman & Hall/CRC, Boca Raton, FL, 2005. Derivado de manual disponível gratuitamente no site do autor, esta é uma das melhores introduções à linguagem para principiantes. Muito didático e com ótimos exercícios. Veja também o site do livro, e o pacote UsingR
.
Crawley, M. J. Statistical Computing – An Introduction to Data Analysis Using S-Plus. New York: Wiley, 2002. Um livro muito completo e feito por um ecólogo, para ensinar estatística e a linguagem. Referência obrigatória para pessoas da área. Veja também o site do livro.
NOTA: Selecionamos aqui três manuais on-line que nos parecem boas introduções. Há muito mais na seção Contributed Documentation do site do R.
Venables, W.; Smith, D.M; & R Development Team An Introduction to R. Manual online. Manual oficial de introdução ao R.
Carlos Alzola and Frank E. Harrell An Introduction to S and the Hmisc and Design Libraries” O Pacote Hmisc veio do S-Plus, e tem várias funções muito úteis para manipulação e análise exploratória de dados. O manual é extenso e é uma referência muito completa sobre a linguagem S.
Petra Kuhnert and Bill Venables An Introduction to R: Software for Statistical Modelling & Computing. Apostila de 360 de curso de Introdução ao R, além dos scripts de aula e conjuntos de dados.
Esta é a referência básica para usuários de R, que inclui programas para download, listas de discussão, e muita documentação e ajuda: http://www.r-project.org/.
Explore as seções, começando pelas FAQ. Leia atentamente a seção 2 (R Basics) das FAQ.
A página tem uma grande lista de documentação, na seção “Documentation”. Há um wiki em construção, e ainda um pouco irregular, mas com boas seções, como a de dicas. Além disso, há excelentes manuais introdutórios feitos por vários voluntários na seção de "Contributed documentation".
Ao fim de cada aula teórica você receberá uma lista de exercícios que serão discutidos na aula seguinte. Por isso, providencie um computador de trabalho e instale o R nele.
Na página principal do R clique no link para o CRAN (o que é isto? veja no wiki!), e escolha o repositório mais próximo de você para baixar arquivos de instalação.
Siga as instruções das FAQS para baixar e instalar a versão mais recente do R para seu sistema operacional.
Vá à seção de pacotes adicionais do R, que te enviará para uma lista e breve descrição dos pacotes disponíveis para baixar. Nela você pode ter uma idéia da quantidade e diversidade de aplicações que a comunidade de usuários do R já desenvolveu. Uma visão temática destes pacotes é fornecida nas “Task Views”, cujo link está na página de pacotes.
Veja a Task view “Environmetrics” , que descreve as aplicações disponíveis para ecologia. Escolha um dos pacotes e instale em seu computador.
Abra o R em seu computador. Você verá um prompt
de comando em forma de sinal de maior (>
). Digite no prompt
cada linha do código abaixo e tecle enter
para executar. Cuidado com erros de digitação, que possivelmente gerarão erros de sintaxe, o que resultará em uma mensagem de erro.
Tente inferir o que cada comando faz a partir do resultado obtido, mas não se preocupe com detalhes. O objetivo é apenas familiarizar-se com o ambiente do R.
Discutiremos este tutorial na primeira aula.
area <- c(303, 379, 961, 295, 332, 47, 122, 11, 53, 2749) riqueza <- c(3, 10, 20, 7, 8, 4, 8, 3, 5, 23) area riqueza summary(area) summary(riqueza) mean(x=area) varea <- var(area) varea sqrt(varea) sd(x=area) mean(riqueza) var(riqueza) sd(riqueza) plot(x=area, y=riqueza, xlab="Area (ha)", ylab="Número de Espécies") modelo1 <- lm(riqueza~area) summary(modelo1) previsto <- fitted(modelo1) riqueza - previsto residuals(modelo1) par(mfrow=c(2,2)) plot(modelo1) par(mfrow=c(1,1)) plot(x=area, y=riqueza, xlab="Area (ha)", ylab="Número de Espécies") abline(modelo1) plot(x=area, y=riqueza, xlab="Log Area (ha)", ylab="Log Número de Espécies", log="xy") modelo2 <- lm(log(riqueza,base=10)~log(area,base=10)) summary(modelo2) par(mfrow=c(2,2)) plot(modelo2) par(mfrow=c(1,1)) plot(area, riqueza, xlab="Log Area (ha)", ylab="Log Número de Espécies", log="xy") abline(modelo2) # O que este comando faz? ## Fim!