Tabela de conteúdos

BIE5782 - Uso da Linguagem R Para Análise de Dados em Ecologia

Bem vido(a). Aqui você encontrará a programação de nossa disciplina, ministrada em maio de 2008 no Instituto de Biocências da USP, e outras informações importantes. Além disto, há algumas atividades prévias a cumprir antes do início das aulas.

Informações Gerais

Disciplina oferecida pelo Programa de Pós-Graduação em Ecologia da Universidade de São Paulo

Equipe

Coordenador: Prof. Paulo Inácio K. L. Prado, IB-USP (prado at ib ponto usp ponto br, fone 11-30917599)

Participantes:

Período e Horários

Locais das aulas

As aulas ocorrerão em diferentes salas do Instituto de Biociências da USP, esteja atento(a) ao programa abaixo.

Programação

Data Período Local Assunto Professor
05/05 8:30 - 12:30AG BotânicaFilosofia e histórico da linguagem R, Introdução à linguagem RPaulo
06/05 8:30 - 12:30AG BotânicaFunções matemáticas e estatísticas no RPaulo
07/05 8:30 - 12:30Minas 3Leitura e Manipulação de DadosPaulo
08/05 8:30 - 12:30AG BotânicaAnálise Exploratória de Dados: estatística descritiva e gráficosRodrigo
09/05 8:00 - 12:00Anf AdminIntrodução a Modelos Lineares: operações matriciaisRodrigo
12/05 8:30 - 12:30AG BotânicaNoções de Programação em Linguagem R: construção de funções simplesAlexandre
13/05 8:30 - 12:30AG BotânicaModelos LinearesRodrigo
14/05 8:30 - 12:30Minas 3Modelos LinearesRodrigo
15/05 8:30 - 12:30AG BotânicaExercícios e discussão modelosPaulo e Alexandre
16/05 8:30 - 12:00Anf AdminSimulação e ReamostragemAlexandre
16/05 14:30 - 17:00Auditório 2Tira-dúvidas, avaliação da disciplinaPaulo e Alexandre

Material de Apoio

Slides das Aulas

Códigos Apresentados em Aula

IMPORTANTE: apague a extensão pdf antes de usar

Exercícios

Soluções dos Exercícios

IMPORTANTE: apague a extensão pdf antes de usar

Dados e Outros

Bibliografia Básica

Livros

William N. Venables and Brian D. Ripley. Modern Applied Statistics with S. Fourth Edition. Springer, New York, 2002. Conhecido na comunidade R como “The Book”, é a referência básica do usuário. Seu pacote companheiro é o MASS1), que faz parte da instalação básica do R. Visite o site do livro para atualizações, exercícios e muito mais.

John Fox. An R and S-Plus Companion to Applied Regression. Sage Publications, Thousand Oaks, CA, USA, 2002. Excelente livro sobre regressão linear, e uma ótima introdução à construção de modelos no R. O pacote companheiro, car, tem ótimas funções para diagnóstico de regressões. Visite também o site do livro.

John Verzani. Using R for Introductory Statistics. Chapman & Hall/CRC, Boca Raton, FL, 2005. Derivado de manual disponível gratuitamente no site do autor, esta é uma das melhores introduções à linguagem para principiantes. Muito didático e com ótimos exercícios. Veja também o site do livro, e o pacote UsingR .

Crawley, M. J. Statistical Computing – An Introduction to Data Analysis Using S-Plus. New York: Wiley, 2002. Um livro muito completo e feito por um ecólogo, para ensinar estatística e a linguagem. Referência obrigatória para pessoas da área. Veja também o site do livro.

Documentação On Line

NOTA: Selecionamos aqui três manuais on-line que nos parecem boas introduções. Há muito mais na seção Contributed Documentation do site do R.

Venables, W.; Smith, D.M; & R Development Team An Introduction to R. Manual online. Manual oficial de introdução ao R.

Carlos Alzola and Frank E. Harrell An Introduction to S and the Hmisc and Design Libraries O Pacote Hmisc veio do S-Plus, e tem várias funções muito úteis para manipulação e análise exploratória de dados. O manual é extenso e é uma referência muito completa sobre a linguagem S.

Petra Kuhnert and Bill Venables An Introduction to R: Software for Statistical Modelling & Computing. Apostila de 360 de curso de Introdução ao R, além dos scripts de aula e conjuntos de dados.

Atividades Preparatórias

Explore a Página Oficial do R

Esta é a referência básica para usuários de R, que inclui programas para download, listas de discussão, e muita documentação e ajuda: http://www.r-project.org/.

Explore as seções, começando pelas FAQ. Leia atentamente a seção 2 (R Basics) das FAQ.

A página tem uma grande lista de documentação, na seção “Documentation”. Há um wiki em construção, e ainda um pouco irregular, mas com boas seções, como a de dicas. Além disso, há excelentes manuais introdutórios feitos por vários voluntários na seção de "Contributed documentation".

Instale o R em seu Computador de Trabalho

Ao fim de cada aula teórica você receberá uma lista de exercícios que serão discutidos na aula seguinte. Por isso, providencie um computador de trabalho e instale o R nele.

Na página principal do R clique no link para o CRAN (o que é isto? veja no wiki!), e escolha o repositório mais próximo de você para baixar arquivos de instalação.

Siga as instruções das FAQS para baixar e instalar a versão mais recente do R para seu sistema operacional.

Vá à seção de pacotes adicionais do R, que te enviará para uma lista e breve descrição dos pacotes disponíveis para baixar. Nela você pode ter uma idéia da quantidade e diversidade de aplicações que a comunidade de usuários do R já desenvolveu. Uma visão temática destes pacotes é fornecida nas “Task Views”, cujo link está na página de pacotes.

Veja a Task view “Environmetrics” , que descreve as aplicações disponíveis para ecologia. Escolha um dos pacotes e instale em seu computador.

Familiarize-se com o R

Abra o R em seu computador. Você verá um prompt de comando em forma de sinal de maior (>). Digite no prompt cada linha do código abaixo e tecle enter para executar. Cuidado com erros de digitação, que possivelmente gerarão erros de sintaxe, o que resultará em uma mensagem de erro.

Tente inferir o que cada comando faz a partir do resultado obtido, mas não se preocupe com detalhes. O objetivo é apenas familiarizar-se com o ambiente do R.

Discutiremos este tutorial na primeira aula.

area <- c(303, 379, 961, 295, 332, 47,  122, 11, 53, 2749)
riqueza <- c(3, 10, 20, 7, 8, 4, 8, 3, 5, 23)
area
riqueza
summary(area)
summary(riqueza)
mean(x=area)
varea <- var(area)
varea
sqrt(varea)
sd(x=area)
mean(riqueza)
var(riqueza)
sd(riqueza)
plot(x=area, y=riqueza, xlab="Area (ha)", ylab="Número de Espécies")
modelo1 <- lm(riqueza~area)
summary(modelo1)
previsto <- fitted(modelo1)
riqueza - previsto
residuals(modelo1)
par(mfrow=c(2,2))
plot(modelo1)
par(mfrow=c(1,1))
plot(x=area, y=riqueza, xlab="Area (ha)", ylab="Número de Espécies")
abline(modelo1)
plot(x=area, y=riqueza, xlab="Log Area (ha)", ylab="Log Número de Espécies", log="xy")
modelo2 <- lm(log(riqueza,base=10)~log(area,base=10))
summary(modelo2)
par(mfrow=c(2,2))
plot(modelo2)
par(mfrow=c(1,1))
plot(area, riqueza, xlab="Log Area (ha)", ylab="Log Número de Espécies", log="xy")
abline(modelo2)
# O que este comando faz?
## Fim!
1)
este e os demais pacotes citados aqui estão disponíveis no CRAN