Amostragem em Hipercubo Latino Assintóticos

Estou tentando construir uma prova para um problema em que estou trabalhando e uma das suposições que estou fazendo é que o conjunto de pontos dos quais estou amostrando é denso em todo o espaço. Na prática, estou usando a amostragem de hipercubo latino para obter meus pontos em todo o espaço amostral. O que eu gostaria de saber é se as amostras de hipercubo latino são densas em todo o espaço, se você deixar o tamanho da amostra tender a ? Nesse caso, uma citação para esse fato seria muito apreciada. $\infty$

— kjetil b halvorsen
fonte

Sim, assumindo uma distribuição contínua, porque para qualquer você pode definir o número de divisões para que todos os intervalos por variável tenham largura . Assim, pelo menos um hiperintervalo (ou seja, volume de amostra) é estritamente contido por um hipercubo de largura torno de qualquer ponto que você escolher. (Comentário, não resposta, como tudo o que sei sobre LHS vem da Wikipedia a partir de dez minutos atrás ...)

ϵ > 0

$\epsilon>0$

< ϵ / 2

$<\epsilon/2$

ϵ

$\epsilon$

— Creosote

Isso é verdade, mas não acho que possa ser facilmente usado para mostrar a densidade de grandes amostras do Latin Hypercube. A razão para isso é que os pontos amostrados no LHS não são independentes: a existência de um ponto de amostra dentro de um hiperintervalo específico impede que outros pontos de amostra apareçam na mesma linha / coluna (ou seja qual for o termo multidimensional para isso) .

— S. Catterall Restabelece Monica

@Creosote, você acha que poderia formalizar mais sua resposta?

@RustyStatistician, expanda seu post de abertura para explicar, de maneira formal, conforme exigido por sua prova, o que você quer dizer com "o conjunto de pontos dos quais estou amostrando é denso em todo o espaço". Obrigado.

— 22415 Creosote

Se eu pegar uma amostra inicial do Latin Hypercube, em que é tão grande, consideramos inifinty, essa amostra é densa?

n

$n$

Respostas:

Resposta curta: Sim, de maneira probabilística. É possível mostrar que, dada qualquer distância , qualquer subconjunto finito do espaço da amostra e qualquer 'tolerância' prescrita , para tamanhos de amostra adequadamente grandes, podemos ser certifique-se de que a probabilidade de que haja um ponto de amostra a uma distância de seja para todos os . $\epsilon>0$ $\{x_1,…,x_m\}$ $\delta>0$ $\epsilon$ $x_i$ $>1-\delta$ $i=1,…,m$

Resposta longa: Não conheço nenhuma citação diretamente relevante (mas veja abaixo). A maior parte da literatura sobre a amostragem de hipercubo latino (LHS) está relacionada às suas propriedades de redução de variância. A outra questão é: o que significa dizer que o tamanho da amostra tende a ? Para amostragem aleatória simples de IID, uma amostra do tamanho pode ser obtida de uma amostra do tamanho anexando uma amostra independente adicional. Para o LHS, acho que você não pode fazer isso, pois o número de amostras é especificado antecipadamente como parte do procedimento. Assim, parece que você tem que tomar uma série de independentes amostras LHS de tamanho . $\infty$ $n$ $n-1$ $1,2,3,...$

Também precisa haver alguma maneira de interpretar 'denso' no limite, pois o tamanho da amostra tende a . A densidade não parece ser determinante para o LHS, por exemplo, em duas dimensões, você pode escolher uma sequência de amostras de tamanho do LHS modo que todas fiquem na diagonal de . Portanto, algum tipo de definição probabilística parece necessária. Seja, para todo , uma amostra do tamanho gerado de acordo com algum mecanismo estocástico. Assume-se que, para diferentes , estas amostras são independentes. Então, para definir a densidade assintótica, podemos exigir que, para cada , e para cada $\infty$ $1,2,3,...$ $[0,1)^2$ $n$ $X_n=(X_{n1},X_{n2},...,X_{nn})$ $n$ $n$ $\epsilon>0$ $x$ no espaço de amostra (assumido como ), temos ( como ). $[0,1)^d$ $P(min_{1\leq k\leq n} \|X_{nk}-x\|\geq \epsilon)\to0$ $n\to \infty$

Se a amostra for obtida colhendo amostras independentes da distribuição ('amostragem aleatória IID'), então que é o volume da esfera dimensional do raio . Portanto, certamente, a amostragem aleatória do DII é assintoticamente densa. $X_n$ $n$ $U([0,1)^d)$

P (m i n_{1 \leq k \leq n} ‖ X_{n k} - x ‖ \geq ϵ) = \prod_{k = 1}^{n} P (‖ X_{n k} - x ‖ \geq ϵ) \leq (1 - v_{ϵ} 2^{- d})^{n} \to 0

$P(min_{1\leq k\leq n} \|X_{nk}-x\|\geq \epsilon)=\prod_{k=1}^n P(\|X_{nk}-x\|\geq \epsilon)\leq (1-v_\epsilon 2^{-d})^n \to 0$

v_{ϵ}

$v_\epsilon$

d

$d$

ϵ

$\epsilon$

Agora considere o caso em que as amostras são obtidas pelo LHS. O teorema 10.1 nestas notas afirma que os membros da amostra estão todos distribuídos como . No entanto, as permutações usadas na definição de LHS (embora independentes para diferentes dimensões) induzem alguma dependência entre os membros da amostra ( ), portanto é menos óbvio que a propriedade de densidade assintótica se mantém. $X_n$ $X_n$ $U([0,1)^d)$ $X_{nk}, k\leq n$

Corrija e . Defina . Queremos mostrar que . Para fazer isso, podemos usar a Proposição 10.3 nessas notas , que é uma espécie de Teorema do Limite Central para Amostragem de Hipercubo Latino. Defina por se estiver na esfera do raio torno de , caso contrário. A proposição 10.3 nos diz que que e $\epsilon\gt 0$ $x\in [0,1)^d$ $P_n=P(min_{1\leq k\leq n} \|X_{nk}-x\|\geq \epsilon)$ $P_n\to 0$ $f:[0,1]^d\to\mathbb{R}$ $f(z)=1$ $z$ $\epsilon$ $x$ $f(z)=0$ $Y_n:=\sqrt n (\hat{\mu}_{LHS}-\mu)\xrightarrow{d} N(0,\Sigma)$ $\mu=\int_{[0,1]^d} f(z) dz$ $\hat{\mu}_{LHS}=\frac{1}{n}\sum_{i=1}^n f(X_{ni})$ .

Tome . Eventualmente, para grande o suficiente , teremos . Então, eventualmente, teremos . Portanto, , em que é o cdf normal padrão. Como era arbitrário, segue-se que conforme necessário. $L>0$ $n$ $-\sqrt n\mu\lt -L$ $P_n=P(Y_n=-\sqrt n \mu)\le P(Y_n\lt -L)$ $\limsup P_n\le \limsup P(Y_n\lt -L)=\Phi(\frac{-L}{\sqrt\Sigma})$ $\Phi$ $L$ $P_n\to 0$

Isso prova a densidade assintótica (conforme definido acima) para a amostragem aleatória iid e o LHS. Informalmente, isso significa que, dado qualquer e no espaço de amostragem, a probabilidade de a amostra chegar a de pode ser tão próxima de 1 quanto você desejar, escolhendo o tamanho da amostra suficientemente grande. É fácil estender o conceito de densidade assintótica para aplicar a subconjuntos finitos do espaço amostral - aplicando o que já sabemos a cada ponto do subconjunto finito. Mais formalmente, isso significa que podemos mostrar: para qualquer e qualquer subconjunto finito do espaço da amostra, $\epsilon$ $x$ $\epsilon$ $x$ $\epsilon>0$ $\{x_1,...,x_m\}$ $min_{1\leq j\leq m} P(min_{1\leq k\leq n} \|X_{nk}-x_j\|\lt \epsilon)\to 1$ (como ). $n\to\infty$

— S. Catterall Restabelece Monica
fonte

Eu tenho duas perguntas: 1) Se você tem apenas uma amostra do tamanho onde é grande, isso muda o argumento? E 2) as amostras de hipercubos latinos podem estar em qualquer faixa de valores (não necessariamente apenas (0,1)). Isso também muda a resposta?

n

$n$

n

$n$

Além disso, você gostaria de explicar por que, para grandes o suficiente , teremos ? Eu suponho que isso significa que, para grandes , vai para zero, porque na distribuição é um ?

n

$n$

- \sqrt{n} μ

$-\sqrt{n}\mu$

n

$n$

{\hat{μ}}_{L H S}

$\hat\mu_{LHS}$

N (0, Σ)

$N(0,\Sigma)$

@RustyStatistician Tudo é definido em termos de amostras finitas, isto é, mas grande. Adicionei algumas explicações adicionais no final para explicar o que está acontecendo. Outras faixas de valores podem ser facilmente acomodadas ((0,1) não é especial), desde que o volume do espaço da amostra seja finito.

n < \infty

$n\lt\infty$

— S. Catterall Restabelece Monica

Você pode elaborar sua resposta curta?

@RustyStatistician A resposta curta é um resumo informal da minha resposta longa que, acho que você concorda, já é bastante elaborada! Portanto, como sugerido acima, seria bom se você pudesse reescrever sua pergunta em termos mais formais, para que eu saiba se minha tentativa de resposta está no caminho certo (em termos de resposta à pergunta pretendida) ou não.

— S. Catterall Restabelece Monica

Não tenho certeza se é isso que você quer, mas aqui vai.

Você está amostrando LHS pontos de , digamos. Argumentaremos de maneira muito informal que, para qualquer , o número esperado de (hiper) cuboides de tamanho em cada dimensão chega a zero como . $n$ $[0,1)^d$ $\epsilon>0$ $\epsilon$ $n\to\infty$

Seja modo que, se dividirmos uniformemente em cubos minúsculos - microcubóides , digamos - de largura então cada largura - cubóide contém pelo menos um microcubóide. Portanto, se pudermos mostrar que o número esperado de microcubóides não amostrados é zero, no limite de , então terminamos. (Observe que nossos microcubóides são organizados em uma grade regular, mas os -cuboids podem estar em qualquer posição.) $m=\lceil 2/\epsilon \rceil$ $[0,1)^d$ $m^d$ $1/m$ $\epsilon$ $n\to\infty$ $\epsilon$

A chance de perder completamente um determinado microcubóide com o primeiro ponto de amostra é , independente de , pois o primeiro conjunto de coordenadas de amostra (primeiro ponto de amostra) pode ser escolhido livremente. Dado que todos os primeiros pontos de amostra perderam esse microcubóide, os pontos de amostra subsequentes terão mais dificuldade em errar (em média); portanto, a chance de todos os pontos em falta é menor que . $1-m^{-d}$ $n$ $d$ $n$ $(1-m^{-d})^n$

Existem microcubóides em , portanto o número esperado que está faltando é delimitado acima por - porque as expectativas adicionam - o que é zero no limite como . $m^d$ $[0,1)^d$ $m^d(1-m^{-d})^n$ $n\to\infty$

Atualizações ...

(1) Aqui está uma figura mostrando como, por dado , você pode escolher grande o suficiente para que uma grade de "microcuboids" (quadrados nesta ilustração bidimensional) garanta a presença de pelo menos um microcubóide qualquer região de tamanho . Eu mostrei duas regiões "aleatoriamente" - escolhidas e pintei de roxo os dois microcubóides que eles contêm. $\epsilon$ $m$ $m\times m$ $\epsilon\times\epsilon$ $\epsilon\times\epsilon$

(2) Considere qualquer microcubóide em particular. Possui volume , uma fração de todo o espaço. Portanto, a primeira amostra do LHS - que é a única escolhida completamente livremente - perderá a amostra com probabilidade . O único fato importante é que esse é um valor fixo (deixaremos , mas manteremos constante) menor que . $(1/m)^d$ $m^{-d}$ $1-m^{-d}$ $n\to\infty$ $m$ $1$

(3) Agora pense no número de pontos de amostra . Eu ilustrei na imagem. O LHS funciona em uma malha fina desses minúsculos "nanocuboids" (se você preferir), e não nos maiores "microcuboids", mas isso não é importante na prova. A prova precisa apenas da afirmação levemente ondulada de que fica gradualmente mais difícil, em média, continuar perdendo um determinado microcubóide à medida que você perde mais pontos. Portanto, havia uma probabilidade de para o primeiro ponto do LHS ausente, mas menor que para todos os deles faltando: isso é zero no limite como $n>m$ $n=6m$ $n^{-1}\times n^{-1}$ $m^{-1}\times m^{-1}$ $1-m^{-d}$ $(1-m^{-d})^n$ $n$ $n\to\infty$ .

(4) Todos esses epsilons são bons para uma prova, mas não são ótimos para sua intuição. Assim, são aqui um par de imagens que ilustra a e amostras pontos, com a maior área vazia rectangular em destaque. (A grade é a grade de amostragem do LHS - os "nanocubóides" mencionados anteriormente.) Deveria ser "óbvio" (em algum sentido intuitivo) que a maior área vazia encolherá para um tamanho arbitrariamente pequeno conforme o número de pontos de amostra . $n=10$ $n=50$ $n\to\infty$

— Creosote
fonte

Esse argumento vale para qualquer intervalo geral? Em vez de ?

[0, 1)

$[0,1)$

Sim, para quaisquer dimensões finitas. Deveria ficar mais claro agora que consertei a prova.

— Creosote

é possível fornecer uma imagem 1-ou 2-d dessa prova? Estou muito perdido nisso.

Feito. É um prazer responder a outras perguntas, se necessário.

— Creosote

Awesome thanks! Isso definitivamente ajuda agora com a intuição.