Posso usar o bootstrapping, por que ou por que não?


10

Atualmente, estou trabalhando em estimativas de biomassa usando imagens de satélite. Definirei rapidamente o plano de fundo da minha pergunta e depois explicarei a questão estatística em que estou trabalhando.

fundo

Problema

Estou tentando estimar biomassa em uma área na França. Minha resposta é a densidade do volume de madeira a vapor (em ), que é mais ou menos proporcional à biomassa (dependendo das densidades da madeira ...).m3/ha

As variáveis ​​independentes que tenho são índices de vegetação derivados de refletâncias medidas sobre essa área (o satélite usado no estudo é MODIS para quem a conhece). Esses índices são, por exemplo, NDVI, EVI, etc. Eu tenho mapas dos índices e a resolução dos mapas é de 250m.

Existem fortes correlações entre esses índices e o volume em um mesmo tipo de floresta (bioma e clima). Então, eu estou tentando regredir a densidade do volume em relação a esses indicadores (na verdade, suas séries temporais) em gráficos de estoque nos quais conheço o volume.

Inventários florestais

O volume dessas parcelas é estimado com o seguinte método de amostragem:

  1. Os nós de estoque são colocados em uma grade regular que cobre a área.
  2. Uma plotagem é anexada a cada nó e o processo de inventário (tipos de árvores, volumes, altura da copa etc.) ocorre nessa plotagem. É claro que estou interessado apenas no gráfico do inventário e os valores dos meus índices de vegetação são o valor do pixel que contém o gráfico.
  3. O processo de inventário em uma plotagem é o seguinte:

    http://i.stack.imgur.com/DeHdC.png

    • Medida das árvores com diâmetro> 37,5cm no círculo de 15m de raio
    • Medida das árvores com diâmetro> 22,5cm no círculo de 9m de raio
    • Medida das árvores com diâmetro> 7,5 cm no círculo de 6 m de raio

A densidade do volume é então calculada usando fatores de expansão.

Para cada parcela, tenho acesso aos dados de todas as árvores medidas.

Além disso, para cada árvore, tenho uma incerteza no volume devido ao uso de equações alométricas (digamos 10%).

Onde as estatísticas são importantes ...

Para que minhas regressões sejam mais precisas, preciso para cada estimativa de volume a variação / IC dessa medida. Isso depende, na IMO, do número de árvores amostradas e da densidade de volume encontrada.

Então, eu tenho dois problemas:

  1. Como explicar o fato de que meus índices de vegetação são medidos em um pixel de 250m?

    Eu posso assumir que a densidade do volume é constante em um pixel e que eu amostro esse pixel com um gráfico de inventário.

  2. Como estimar a variabilidade da minha densidade de volume?

    Eu acho que eu poderia usar bootstrapping na população de árvores. Mas meu número total de árvores medidas pode ser bem pequeno (de 7 a 20 ...). Além disso, como posso levar em consideração o fato de estar medindo as árvores em diferentes círculos, dependendo do tamanho? E como a variabilidade deve mudar se eu estiver visualizando um pixel inteiro?

Eu também estava pensando que poderia usar uma Simulação de Monte Carlo para simular uma floresta e, em seguida, amostrar aleatoriamente essa floresta com parcelas para ver o que está acontecendo ...

Eu não tenho um forte histórico estatístico, então estou um pouco perdido!

Respostas:


1

Não entendo muito bem seus dados, mas posso dizer que uma alternativa ao auto-inicialização multinomial que funciona melhor para eventos raros é a perturbação / auto-inicialização selvagem. A perturbação é extremamente flexível e muitas vezes é capaz de lidar com dados não-iid, no entanto, às vezes, é necessária muita delicadeza para aproximar corretamente o cdf. Se você conseguir especificar corretamente a fórmula de autoinicialização, fará menos suposições e provavelmente menos tendencioso do que o método de suavização sugerido anteriormente, principalmente devido ao seu conjunto de dados esparso, o que pode tornar instáveis ​​as estimativas de densidade.


0

Se eu tivesse que abordar esse problema, começaria primeiro por:

  1. olhando para um mapa dos dados de origem
  2. tentando algum tipo de suavização 2D na superfície, tente informá-lo com a AIC
  3. calcule a derivada do liso no local e relacione a variação na entrada com a variação na saída usando o método delta
  4. Compare os resultados disso com alguns valores "conhecidos" para verificar / validar a abordagem

Links relevantes: http://www.stanford.edu/class/cme308/notes/TaylorAppDeltaMethod.pdf http://www.ingentaconnect.com/content/klu/stco/2010/00000020/00000004/00009140?crawler=true

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.