====== BIE5782 - Uso da Linguagem R Para Análise de Dados em Ecologia ====== Bem vido(a). Aqui você encontrará a programação de nossa disciplina, ministrada em maio de 2008 no Instituto de Biocências da USP, e outras informações importantes. Além disto, há algumas atividades prévias a cumprir antes do início das aulas. ===== Informações Gerais ===== Disciplina oferecida pelo Programa de Pós-Graduação em Ecologia da Universidade de São Paulo ==== Equipe ==== **Coordenador**: Prof. Paulo Inácio K. L. Prado, IB-USP (prado //at// ib //ponto// usp //ponto// br, fone 11-30917599) **Participantes**: * Prof. Alexandre Adalardo de Oliveira, IB-USP(adalardo //at// usp //ponto// br) * Prof. Rodrigo Augusto Santinelo Pereira, FFCLRP-USP (raspereira //at// yahoo //ponto// com //ponto// br) * Prof. João Luís Ferreira Batista, ESALQ-USP (parsival //at// usp //ponto// br) ==== Período e Horários==== * Disciplina condensada, 05 a 16 de maio de 2008. * Aulas teóricas de segunda a sexta pelas manhãs, das 8:30 às 12:30 (sextas das 8:00 às 12:00). * Tardes reservadas para resolução de exercícios. * No último dia da disciplina (16/05) teremos também aula teórica pela tarde, das 14:00 às 17:00. ==== Locais das aulas ==== As aulas ocorrerão em diferentes salas do Instituto de Biociências da USP, esteja atento(a) ao programa abaixo. * **AG Botânica**: Auditório do Departamento de Botânica * **Minas 3**: Auditório 3 do Prédio "Minas" (Em frente à entrada do Depto de Botânica) * **Anf Admin**: Anfiteatro do Prédio da Administração * **Auditório 2**: auditório 2 do Centro Didático, no térreo. ===== Programação ===== ^ Data ^Período ^ Local ^ Assunto ^Professor^ |05/05 |8:30 - 12:30|AG Botânica|[[01-introducao|Filosofia e histórico da linguagem R]], [[02-entrada|Introdução à linguagem R]]|Paulo| |06/05 |8:30 - 12:30|AG Botânica|[[03-funcoes|Funções matemáticas e estatísticas no R]]|Paulo| |07/05 |8:30 - 12:30|Minas 3|[[04-dados|Leitura e Manipulação de Dados]]|Paulo| |08/05 |8:30 - 12:30|AG Botânica|[[05-exploratoria|Análise Exploratória de Dados: estatística descritiva e gráficos]]|Rodrigo| |09/05 |8:00 - 12:00|Anf Admin|Introdução a Modelos Lineares: operações matriciais|Rodrigo| |12/05 |8:30 - 12:30|AG Botânica|[[programar_ale|Noções de Programação em Linguagem R: construção de funções simples]]|Alexandre| |13/05 |8:30 - 12:30|AG Botânica|[[06-modelos|Modelos Lineares]]|Rodrigo| |14/05 |8:30 - 12:30|Minas 3|[[06-modelos|Modelos Lineares]]|Rodrigo| |15/05 |8:30 - 12:30|AG Botânica|Exercícios e discussão modelos|Paulo e Alexandre| |16/05 |8:30 - 12:00|Anf Admin|[[08-simulacao|Simulação e Reamostragem]]|Alexandre| |16/05 |14:30 - 17:00|Auditório 2|Tira-dúvidas, avaliação da disciplina|Paulo e Alexandre| ===== Material de Apoio ===== ==== Slides das Aulas ==== * {{biometria:r-tutor:intro_r.pdf|Histórico e Introdução}} * {{biometria:r-tutor:funcoes.pdf|Funções}} * {{biometria:r-tutor:dados.pdf|Leitura e Manipulação de Dados}} * {{biometria:r-tutor:aula04-aed-2008.pdf|Gráficos e AED}} * {{biometria:r-tutor:aula05-aed_algebra-2008.pdf|Introdução modelos e operações matriciais}} * {{biometria:r-tutor:programar.pdf|Nocões de Programação}} * {{biometria:r-tutor:aula08-intro-modelos-2008.pdf|Modelos Lineares}} * {{biometria:r-tutor:aula09-colineariedade-selecao-modelos-2008.pdf|Colineariedade e seleção de modelos}} * {{biometria:r-tutor:reamostragem_e_simulacao.pdf|Reamostragem e Simulação}} ==== Códigos Apresentados em Aula ==== ** __IMPORTANTE__: apague a extensão //pdf// antes de usar ** * {{biometria:r-tutor:Aula05-AED.R.pdf|Gráficos e AED }} * {{biometria:r-tutor:Aula06-Algebra.R.pdf|Introdução modelos e operações matriciais}} * {{biometria:r-tutor:aula07-programar.r.pdf|Noções de Programação}} * {{biometria:r-tutor:aula08-9-intro-modelos.r.pdf|Modelos lineares}} * {{biometria:r-tutor:ancova.r.pdf|Exemplo de ANCOVA (seleção de modelos)}}. Usa conjunto de dados [[biometria:r-tutor:dados-egrandis| "egrandis.csv"]] * {{biometria:r-tutor:script_aula_reamostragem.r.pdf|Reamostragem e Simulação}} ==== Exercícios ==== * {{biometria:r-tutor:lista-aula06-algebra-2008.pdf|Introdução modelos e operações matriciais}} * {{biometria:r-tutor:nocoes_de_programacao_aula_7.pdf|Noções de programação}} * {{biometria:r-tutor:lista-modelos-lineares-2008.pdf|Modelos lineares}} ==== Soluções dos Exercícios ==== ** __IMPORTANTE__: apague a extensão //pdf// antes de usar ** * {{biometria:r-tutor:exerc3.r.pdf|Funções }} * {{biometria:r-tutor:exerc4.r.pdf|Leitura e Manipulação de Dados}} * {{biometria:r-tutor:resolucao-lista-graficos.pdf|Gráficos e AED}} * {{biometria:r-tutor:exer6.r.pdf|Introdução modelos e operações matriciais}} * {{biometria:r-tutor:exer7.r.pdf|Noções de programação -Solução Paulo}} * {{biometria:r-tutor:scriptexercprogramar.r.pdf|Noções de programação -Solução Alê}} ==== Dados e Outros ==== * {{biometria:r-tutor:figueiredo_al1995.pdf|Artigo para lista de ex: “Figueiredo et al. 1995. Ciência Hoje 20: 61-62”}} * {{biometria:r-tutor:dados-aulas4e5.zip|Dados vespas e galhadores para listas, aulas Rodrigo}} * {{biometria:r-tutor:vespas.completo.txt.pdf|Dados vespas completo para listas, apagar extensão pdf}} * {{biometria:r-tutor:petit_gateau.pdf|Receita de Petit Gateau de Chocolate}} * [[http://www.tacom.com.ve/textosentido/invitados/borges.html|Del rigor de la ciencia]], uma vinheta sobre modelos, por J.L. Borges. ===== Bibliografia Básica===== ==== Livros ==== **William N. Venables and Brian D. Ripley. Modern Applied Statistics with S. Fourth Edition. Springer, New York, 2002.** Conhecido na comunidade R como //"The Book"//, é a referência básica do usuário. Seu pacote companheiro é o ''MASS''((este e os demais pacotes citados aqui estão disponíveis no CRAN)), que faz parte da instalação básica do R. Visite o [[http://www.stats.ox.ac.uk/pub/MASS4/|site]] do livro para atualizações, exercícios e muito mais. **John Fox. An R and S-Plus Companion to Applied Regression. Sage Publications, Thousand Oaks, CA, USA, 2002.** Excelente livro sobre regressão linear, e uma ótima introdução à construção de modelos no R. O pacote companheiro, ''car'', tem ótimas funções para diagnóstico de regressões. Visite também o [[http://socserv.socsci.mcmaster.ca/jfox/Books/Companion/index.html|site]] do livro. **John Verzani. Using R for Introductory Statistics. Chapman & Hall/CRC, Boca Raton, FL, 2005.** Derivado de manual [[http://www.math.csi.cuny.edu/Statistics/R/simpleR/printable/simpleR.pdf|disponível gratuitamente]] no site do autor, esta é uma das melhores introduções à linguagem para principiantes. Muito didático e com ótimos exercícios. Veja também o [[http://wiener.math.csi.cuny.edu/UsingR/|site]] do livro, e o pacote ''UsingR'' . **Crawley, M. J. Statistical Computing – An Introduction to Data Analysis Using S-Plus. New York: Wiley, 2002.** Um livro muito completo e feito por um ecólogo, para ensinar estatística e a linguagem. Referência obrigatória para pessoas da área. Veja também o [[http://www.bio.ic.ac.uk/research/mjcraw/statcomp/|site]] do livro. ==== Documentação On Line ==== **NOTA:** Selecionamos aqui três manuais on-line que nos parecem boas introduções. Há muito mais na seção [[http://cran.r-project.org/other-docs.html|Contributed Documentation]] do site do R. **Venables, W.; Smith, D.M; & R Development Team ** [[http://cran.r-project.org/doc/manuals/R-intro.pdf|An Introduction to R. Manual online]]. Manual oficial de introdução ao R. **Carlos Alzola and Frank E. Harrell [[http://cran.r-project.org/doc/contrib/Alzola+Harrell-Hmisc-Design-Intro.pdf|An Introduction to S and the Hmisc and Design Libraries]]” ** O Pacote Hmisc veio do S-Plus, e tem várias funções muito úteis para manipulação e análise exploratória de dados. O manual é extenso e é uma referência muito completa sobre a linguagem S. **Petra Kuhnert and Bill Venables [[http://cran.r-project.org/doc/contrib/Kuhnert+Venables-R_Course_Notes.zip|An Introduction to R: Software for Statistical Modelling & Computing]].** Apostila de 360 de curso de Introdução ao R, além dos scripts de aula e conjuntos de dados. ===== Atividades Preparatórias ===== ==== Explore a Página Oficial do R==== Esta é a referência básica para usuários de R, que inclui programas para download, listas de discussão, e muita documentação e ajuda: [[http://www.r-project.org/]]. Explore as seções, começando pelas FAQ. Leia atentamente a seção 2 (**R Basics**) das FAQ. A página tem uma grande lista de documentação, na seção "Documentation". Há um wiki em construção, e ainda um pouco irregular, mas com boas seções, como a de dicas. Além disso, há excelentes manuais introdutórios feitos por vários voluntários na seção de [[http://cran.r-project.org/other-docs.html|"Contributed documentation"]]. ==== Instale o R em seu Computador de Trabalho ==== Ao fim de cada aula teórica você receberá uma lista de exercícios que serão discutidos na aula seguinte. Por isso, providencie um computador de trabalho e instale o R nele. Na página principal do R clique no link para o CRAN (o que é isto? veja [[http://cran.r-project.org/doc/FAQ/R-FAQ.html#What-is-CRAN_003f|no wiki!]]), e escolha o repositório mais próximo de você para baixar arquivos de instalação. Siga as instruções das FAQS para baixar e instalar a versão mais recente do R para seu sistema operacional. Vá à seção de pacotes adicionais do R, que te enviará para uma lista e breve descrição dos pacotes disponíveis para baixar. Nela você pode ter uma idéia da quantidade e diversidade de aplicações que a comunidade de usuários do R já desenvolveu. Uma visão temática destes pacotes é fornecida nas "Task Views", cujo link está na página de pacotes. Veja a Task view "Environmetrics" , que descreve as aplicações disponíveis para ecologia. Escolha um dos pacotes e instale em seu computador. ==== Familiarize-se com o R==== Abra o R em seu computador. Você verá um ''prompt'' de comando em forma de sinal de maior (''>''). Digite no ''prompt'' cada linha do código abaixo e tecle ''enter'' para executar. Cuidado com erros de digitação, que possivelmente gerarão erros de sintaxe, o que resultará em uma mensagem de erro. Tente inferir o que cada comando faz a partir do resultado obtido, mas não se preocupe com detalhes. O objetivo é apenas familiarizar-se com o ambiente do R. Discutiremos este tutorial na primeira aula. area <- c(303, 379, 961, 295, 332, 47, 122, 11, 53, 2749) riqueza <- c(3, 10, 20, 7, 8, 4, 8, 3, 5, 23) area riqueza summary(area) summary(riqueza) mean(x=area) varea <- var(area) varea sqrt(varea) sd(x=area) mean(riqueza) var(riqueza) sd(riqueza) plot(x=area, y=riqueza, xlab="Area (ha)", ylab="Número de Espécies") modelo1 <- lm(riqueza~area) summary(modelo1) previsto <- fitted(modelo1) riqueza - previsto residuals(modelo1) par(mfrow=c(2,2)) plot(modelo1) par(mfrow=c(1,1)) plot(x=area, y=riqueza, xlab="Area (ha)", ylab="Número de Espécies") abline(modelo1) plot(x=area, y=riqueza, xlab="Log Area (ha)", ylab="Log Número de Espécies", log="xy") modelo2 <- lm(log(riqueza,base=10)~log(area,base=10)) summary(modelo2) par(mfrow=c(2,2)) plot(modelo2) par(mfrow=c(1,1)) plot(area, riqueza, xlab="Log Area (ha)", ylab="Log Número de Espécies", log="xy") abline(modelo2) # O que este comando faz? ## Fim!