Ferramentas do usuário

Ferramentas do site


Barra lateral

lcf5876:historico-disciplina:2018:programa:05-operacoes-objetos-dados:05-exercicios
  LCF-5876 Computação no Ambiente R:
Aplicações em Ecologia
e Recursos Florestais
R logo
5. OPERAÇÃO COM OBJETOS DE DADOS

5. Exercícios

5.1. Sub-amostragem


Exercício 5.1.A. Operador de Sub-amostragem

Verifique o resultado do comando:
?"["

Exercício 5.1.B. Sub-amostrando um Vetor Gaussiano

Gere o vetor de uma amostra da distribuição Gaussiana com comprimento 10000, média 30 e desvio padrão 7.
  • Qual o somatório das observações no vetor que são maiores que 44?
  • E o somatório das observações maiores que 51?
  • Como você excluiria a maior observação do vetor?

Exercício 5.1.C. Operações Envolvendo Sub-amostragem

O arquivo dap-altura.rdata é binário do R que contém dois vetores: dap e altura. Esses vetores se referem ao diâmetro (cm) e altura (m) de árvores de Tabebuia cassinoides. Carregue esse arquivo no R e responda as seguintes perguntas:
  • Quantas árvores tem diâmetro (dap) maior que 10cm?
  • Quantas árvores tem diâmetro entre 10 e 20cm?
  • Quantas árvores tem altura (altura) superior a 8m?
  • Qual é a altura média das árvores com diâmetro menor que 15cm?
  • Qual é o diâmetro médio das árvores com altura maior que 10m?
  • Qual é a altura da árvore de maior diâmetro?
  • Qual é o diâmetro da árvore de maior altura?

Exercício 5.1.D. Sub-amostrando uma Matriz Numérica

Crie uma matriz de 5 linhas por 5 colunas a partir de uma amostra aleatória da distribuição exponencial com parâmetro rate = 1/20. Nesta matriz:
  • Selecione os elementos maiores que 10.
  • Quantos valores são menores que 5?
  • Extraia a diagonal principal dessa matriz.
  • Qual a média dos valores maiores que 20?

Exercício 5.1.E. Taxa de Câmbio na Europa antes do Euro

O objeto de dados do R euro.cross é uma matriz contendo as taxas de câmbio da moedas dos países Europeus antes da criação do Euro. Os nomes das moedas (em inglês) estão codificados da seguinte forma:
Moeda Sigla
Austrian Schilling ATS
Belgian Franc BEF
German Mark DEM
Spanish Peseta ESP
Finnish Markka FIM
French Franc FRF
Irish Punt IEP
Italian Lira ITL
Luxembourg Franc LUF
Dutch Guilder NLG
Portuguese Escudo PTE


Pergunta-se:

  • Qual a taxa entre moeda da França e da Alemanha?
  • Qual a taxa entre a moeda de Portugal e da Finlândia?
  • Qual a relação da moeda de Itália em relação a todas as demais?
  • Qual a relação de todas as moedas em relação à moeda da Holanda?
  • Quais as taxas que superam 100 (função which)?
  • Selecione as taxas correspondentes à parte triangular inferior da matriz.

Exercício 5.1.F. Lista de Nomes

Obtenha os nomes das linhas da matriz euro.cross na forma de um vetor, utilizando uma operação de sub-amostragem. Será que existe uma função que automatize essa operação? Qual?

Exercício 5.1.G. Função de Histograma

Utilizando o vetor dap (do arquivo dap-altura.rdata) execute o seguinte comando:
histograma = hist(dap, plot=FALSE)
  • Qual o tipo (type) do objeto histograma?
  • Que outros atributos esse objeto tem?
  • Como você extrairia elementos desse objeto?

Exercício 5.1.H. Sub-amostrando um Data Frame

Leia os dados do arquivo caixeta-exemplo1-1.csv para um objeto no R.
  • Que classe de objeto é esse?
  • Extraia desse objeto, na forma de vetores individuais, os dados referentes às variáveis cap, h e especie.
  • Gere um outro objeto contendo contendo todas as variáveis, mas apenas as árvores com CAP menor que 300 (mm).
  • Gere um outro objeto contendo todas as variáveis, mas apenas as árvores com altura (h) maior que 100 (dm).
  • Gere um outro objeto contendo todas as variáveis, mas apenas as árvores cuja espécie é a Tabebuia cassinoides.

Exercício 5.1.I. Sub-amostrando um Data Frame II

Apague (=remove) do seu workspace os vetores individuais relativos às variáveis cap, h e especie . Repita o exercício anterior sem realizar a extração dessas variáveis na forma de vetores individuais.


5.2. Algumas Operações Úteis


Exercício 5.2.A. Volume de Árvores de Caixeta

Utilizando o conjunto de dados caixeta-exemplo1.csv, adicione a esse conjunto de dados as seguintes variáveis como colunas do mesmo data frame:
  • DAP em centímetros: dap = cap / (10*pi);
  • Altura em metros: h = h/10;
  • Volume em decímetros cúbicos:
    v = 0.04422788 * dap^2.0584 * h^1.0555

Exercício 5.2.B. Alteração de Variáveis Qualitativas

Utilizando o data frame do exercício anterior, faça as seguintes alterações de valor:
  • Altere o valor “indet.1” da variável especie para “Indeterminada 01”.
  • Altere o valor “chauas” da variável local para “Chauás”.

Exercício 5.2.C. Frequência de Cores

Considere o seguinte vetor:
>  cores = c("amarelo","vermelho","azul","laranja")
>

Para gerar uma amostra, com reposição, dessas cores execute o comando:

> muitas.cores = sample(cores, 20, TRUE)
> muitas.cores
 [1] "amarelo"  "azul"     "amarelo"  "amarelo"  "vermelho" "laranja"
 [7] "laranja"  "azul"     "amarelo"  "vermelho" "amarelo"  "laranja"
[13] "azul"     "amarelo"  "amarelo"  "amarelo"  "amarelo"  "vermelho"
[19] "azul"     "laranja"
>     

Como podemos obter uma tabela de freqüência das cores?

Exercício 5.2.D. Cores no Ambiente R

A função colors() lista todas as cores que o R é capaz de gerar.

Quantas dessas cores são variantes da cor salmão (salmon)?

Quantas são variantes de verde?


5.3. A Classe "Factor"


Exercício 5.3.A. Variedades

Crie um factor para representar a situação de variedades de uma espécie:
Variedade Frequência
Variedade A 3
Variedade B 2
Variedade C 4
Variedade D 1


5.4. Agregação


Exercício 5.4.A. Estatísticas Estadosunidenses

Dentre os conjuntos de dados do R, há uma série de vetores que se referem a estatísticas dos Estados dos E.U.A.:
  • state.name: nome dos Estados,
  • state.area: área dos Estados (milhas quadradas),
  • state.division: divisões dos E.U.A. a qual cada Estado pertence,
  • state.region: região dos E.U.A. a qual cada Estado pertence, e
  • astate.x77: uma matriz com 50 linhas (uma para cada estado) e as várias estatísticas nas colunas (consulte a ajuda: help(state.x77)).

Pergunta-se:

  • Qual o maior (em área) Estado dos E.U.A.?
  • Qual a maior divisão?
  • Qual a menor região?
  • Qual a região mais populosa?
  • Qual a região com a menor média de analfabetismo (=illiteracy)?
  • Qual a divisão com a maior taxa de homicídios?

Exercício 5.4.B. Sumarização por Parcela

Utilizando os dados de caixeta (caixeta-grande.csv) faça as seguintes sumarizações por parcela e local:
  • A área basal das árvores em metros quadrados por hectare (assuma que as parcelas tem área de 400m2.
  • O volume de madeira nas parcelas. Calcule o volume das árvores utilizando a equação de volume do exercício 7.10.
  • O desvio padrão dos diâmetros e das alturas das árvores.
  • O número de fustes de árvores de caixeta.
  • A área basal das árvores de caixeta em m2/ha.


5.5. Junção de "Data Frames"


Exercício 5.5.A. Sumarização por Parcela II

Junte os data frames de sumarização calculados no exercício 5.4.B. em um único data frame com todas as sumarizações.




lcf5876/historico-disciplina/2018/programa/05-operacoes-objetos-dados/05-exercicios.txt · Última modificação: 2020/03/06 09:25 por joaoluis