^[[start|Modelos Estatísticos: Abordagem da Verossimilhança]]^ \\ 4. Modelos com Parâmetros Constantes \\ ====== Conceitos ====== * Variáveis aleatórias teóricas como modelos * Parâmetros e estimativas * Simulação de amostras de variáveis aleatórias * Ajuste de modelos por otimização * Diagnóstico de modelos ====== Tutoriais ====== ===== Poisson e Binomial Negativa ===== Vamos retomar [[biometria:verossim:01-distr#binomial_negativa_e_poisson|o tutorial sobre distribuições discretas]], onde simulamos uma distribuição agregada de plantas em uma área dividida em quadrículas (parcelas): set.seed(42) cx <- runif(20,0,20) cy <- runif(20,0,20) px <- rnorm(2000) py <- rnorm(2000) x1 <- cx+px y1 <- cy+py x2 <- x1[x1>0&x1<20&y1>0&y1<20] y2 <- y1[x1>0&x1<20&y1>0&y1<20] x2.parc <- cut(x2,breaks=0:20, labels=1:20) y2.parc <- cut(y2,breaks=0:20, labels=LETTERS[1:20]) O numero de plantas por parcela é obtido com: cont2 <- data.frame(table(x2.parc,y2.parc))$Freq A avaliação visual feita no tutorial anterior indica que a variável binomial negativa é uma descrição mais adequada destes dados. Vamos ajustar estes dois modelos e fazer a comparação. Primeiro definimos funções de log-verossimilhança negativa para cada modelo: LL.pois <- function(lam){ -sum(dpois(cont2,lambda=lam,log=T)) } LL.nbin <- function(media,k){ -sum(dnbinom(cont2,mu=media,size=k,log=T)) } Em seguida minimizamos estas funções. Para isto carregue o pacote //bbmle// e use a função [[http://finzi.psych.upenn.edu/R/library/bbmle/html/mle2.html|mle2]]. É preciso fornecer valores iniciais razoáveis, no argumento ''start'': library(bbmle) # basta uma vez por seção mod1 <- mle2(LL.pois,start=list(lam=mean(cont2))) mod2 <- mle2(LL.nbin,start=(list(media=mean(cont2),k=0.1))) Como esperado, a binomial negativa é um modelo muito mais plausível: > logLik(mod1) 'log Lik.' -1786.502 (df=1) > logLik(mod2) 'log Lik.' -1014.969 (df=2) Você pode obter um resumo dos modelo com o comando ''summary'': summary(mod1) summary(mod2) E podemos fazer um gráfico dos valores previsto pelos dois modelos com: ##MLEs de cada modelo cf1 <- coef(mod1) cf2 <- coef(mod2) ##grafico cont2.f <- factor(cont2, levels=0:max(cont2)) plot(table(cont2.f)/400, xlab="N de indivíduos na parcela", ylab="Proporção das parcelas") points(x=0:max(cont2),y=dpois(0:max(cont2),lambda=cf1), type="b", col="blue", lty=2) points(x=0:max(cont2),y=dnbinom(0:max(cont2),mu=cf2[1],size=cf2[2]), type="b", col="red", lty=2) Por fim, avalie o perfil de verossimilhança dos dois parâmetros da binomial negativa ((para isto você vai precisar da função {{:biometria:verossim:plot-profmle.txt|plot.profmle}})): p.mod2 <- profile(mod2) par(mfrow=c(1,2)) plot.profmle(p.mod2) par(mfrow=c(1,1)) ====== Recursos para Estudo ====== ===== Na Internet ===== * Um roteiro de ajuste de modelos na página do [[http://ecologia.ib.usp.br/let/doku.php?id=tutoriais:tut-mod|Laboratório de Ecologia Teórica]] do IB-USP. * [[http://www.unl.edu/cbrassil/ELME/2007/mlR.pdf|Outro roteiro]], bem mais resumido, da [[http://www.unl.edu/cbrassil/ELME/2007/|disciplina de introdução à modelagem]] com verossimilhança de [[http://www.unl.edu/cbrassil/|Chad Brassil]]. * Excelentes exercícios de simulação e ajustes de distribuições no [[http://www.zoology.ufl.edu/bolker/emdbook/lab6.html|site de apoio de Bolker (2008)]]. ((Bolker, B. (2008). Ecological Models and Data in R. Princeton, Princeton University Press.)) ====== Pesquisa ====== Indique os tutoriais e partes da leitura básica que merecem mais atenção na discussão [[http://ecologia.ib.usp.br/bie5782/doku.php?id=bie5782:verossim:pesquisa1#modelos_com_par%C3%A2metros_constantes_e_sele%C3%A7%C3%A3o_de_modelos|aqui]].